Python编码知识学习笔记
>>>a=‘中‘ ===>a是一个编码之后的二进制,采用的操作系统默认的编码方式,类似于byte
>>>s=u‘中‘ ===>s是一个unicode类型,32bit整数,变量的内容为unicode的码字(codepoint)
>>>a
‘\xd6\xd0‘ ===>如上所述当前系统是GBK编码,GBK编码的二进制值
>>>s
u‘\u4e2d‘ ===>如上所述存储的是码字4e2d,和unicode定义一致
>>>print a
中
>>>print s
中
>>>a.decode(‘gbk‘).encode(‘utf-8‘) ===>对字符串解码后,在使用utf8进行编码
‘\xe4\xb8\xad‘
>>>s.encode(‘utf-8‘) ===>对码字4e2d使用utf8编码方案进行编码,输出编码后的二进制值和上
‘\xe4\xb8\xad‘ ===>一步骤的内容一致
原文:http://blog.csdn.net/jinlxz/article/details/44539865