protobuf数据序列化bug引发的思考

时间：2014-02-22 14:26:42 阅读：577 评论：0 收藏：0 [点我收藏+]

protobuf是Google开发的一个开源序列化框架，类似XML，JSON，其最大的特点是基于二进制，比传统的XML表示同样一段内容要短小得多。通过protobuf，可以很轻松的调用相关方法来完成业务数据的序列化与反序列化。但是，protobuf在使用当中也发现一些问题，数据在protobuf序列化后无法反序列化，这就与protobuf的目的违背。下面我们来看下这个问题吧。

首先定义一个protobuf结构，如下：

message Person {
  required int32 mid = 1;
  required int32 type = 2;
}

再来看下这段代码，看似没有问题：

Person psn0;
psn0.set_mid(1);
psn0.set_type(0);

string str0;
psn0.SerializeToString(&str0);

// 由于网络传输， string 需要转换成 char*
const char* buf = str0.c_str();

// 如果是这样解析，将会引起bug
string str1 = buf;

People psn1;
bool ret1 = psn1.ParseFromString(str1);

if (ret1)
{
	cout << "str1 parse success" << endl;
}
else
{
	cout << "str1 parse fail" << endl;
}

// 这样解析不会引起bug
string str2;
str2.assign(buf, str0.length());

People psn2;
bool ret2 = psn2.ParseFromString(str2);

if (ret2)
{
	cout << "str2 parse success" << endl;
}
else
{
	cout << "str2 parse fail" << endl;
}

运行结果，如下：

str1 parse fail
str2 parse success

这里解释一下原因：在以上例子中，protobuf 序列化的 string 数据里含有 ‘\0‘ 字符。如果以 char* 取protobuf序列化后的数据，将会丢失部分数据。

虽然这个严格意义来讲也不算protobuf的bug，但在protobuf的使用中一般很少人注意protobuf 的数据中带有 ‘\0‘ 字符，这就导致了bug的发生。

参考：

http://blog.csdn.net/mycwq/article/details/19619875

protobuf数据序列化bug引发的思考

原文：http://blog.csdn.net/mycwq/article/details/19619875

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)