首页 > 其他 > 详细

编码的小知识

时间:2018-08-04 17:50:03      阅读:148      评论:0      收藏:0      [点我收藏+]

编码方式:

ASCII

a  8位  一个字节

unicode

a  32位  四个字节

中  32位  四个字节

utf-8

a  8位  一个字节

中  24位  三个字节

gbk

a  8位  一个字节

中  16位  两个字节

1.各个编码之间的二进制,是不能相互识别的,会产生乱码。

2.文件的传输,储存不能是unicode(只能是utf-8,utf-16,gbk,gbk2312,ascii等)

Python3

str 在内存中使用unicode编码

对于英文:

  str:  表现方式:s = ‘alex’

      编码方式:01010101    unicode

  bytes: 表现方式:s = b“alex”

       编码方式:01010100    utf-8,gbk。。。

对于中文:

  str:  表现方式;s = “中国”

      编码方式:01010101  unicode

  bytes: 表现方式:s = b‘x\e93\e91\e30\e02\e32\e42‘

       编码方式:00010001  utf-8,gbk。。。

编码的小知识

原文:https://www.cnblogs.com/albatorss/p/9419238.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!