首页 > 其他 > 详细

protobuf数据序列化bug引发的思考

时间:2014-02-22 14:26:42      阅读:574      评论:0      收藏:0      [点我收藏+]

protobuf是Google开发的一个开源序列化框架,类似XML,JSON,其最大的特点是基于二进制,比传统的XML表示同样一段内容要短小得多。通过protobuf,可以很轻松的调用相关方法来完成业务数据的序列化与反序列化。但是,protobuf在使用当中也发现一些问题,数据在protobuf序列化后无法反序列化,这就与protobuf的目的违背。下面我们来看下这个问题吧。

首先定义一个protobuf结构,如下:

message Person {
  required int32 mid = 1;
  required int32 type = 2;
}
再来看下这段代码,看似没有问题:

Person psn0;
psn0.set_mid(1);
psn0.set_type(0);

string str0;
psn0.SerializeToString(&str0);

// 由于网络传输, string 需要转换成 char*
const char* buf = str0.c_str();

// 如果是这样解析,将会引起bug
string str1 = buf;

People psn1;
bool ret1 = psn1.ParseFromString(str1);

if (ret1)
{
	cout << "str1 parse success" << endl;
}
else
{
	cout << "str1 parse fail" << endl;
}

// 这样解析不会引起bug
string str2;
str2.assign(buf, str0.length());

People psn2;
bool ret2 = psn2.ParseFromString(str2);

if (ret2)
{
	cout << "str2 parse success" << endl;
}
else
{
	cout << "str2 parse fail" << endl;
}

运行结果,如下:

str1 parse fail
str2 parse success

这里解释一下原因:在以上例子中,protobuf 序列化的 string 数据里含有 ‘\0‘ 字符。如果以 char* 取protobuf序列化后的数据,将会丢失部分数据。

虽然这个严格意义来讲也不算protobuf的bug,但在protobuf的使用中一般很少人注意protobuf 的数据中带有 ‘\0‘ 字符,这就导致了bug的发生。

参考:

http://blog.csdn.net/mycwq/article/details/19619875

protobuf数据序列化bug引发的思考

原文:http://blog.csdn.net/mycwq/article/details/19619875

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!