首页 > 其他 > 详细

py03_03:字符集的转换

时间:2020-03-01 22:17:29      阅读:69      评论:0      收藏:0      [点我收藏+]

首先了解一下支持我国的字符集的发展历史

  从最开始的ASCII--->gb2312--->gbk--->unicode--->utf-8

  ASCII:不支持中文

  gb2312:支持中文2000多个

  gbk:支持中文两万多个

  unicorn:万国编码

  utf-8:包含符合各国语言的字符集 

 

字符集之间的转换,如下图所示

技术分享图片

 

 

 decode:转换成unicode,万国编码。  注意:转换成unicode,得告诉电脑,你原来的什么编码,要不然计算机是无法知道你原来编码的类型,会出错

 encode:转换成utf-8,或者其他各国的字符集

 

例子1:从gbk转换成utf-8

  a.decode(‘gbk‘).encode(‘utf-8)

例子2:从utf-8转换成gbk

  a.decode(‘utf-8‘).encode(‘‘gbk)

 

 

最后说一下,utf-8转unicode的办法:a = u‘value’ ,前端加u也可以。

py03_03:字符集的转换

原文:https://www.cnblogs.com/yeyu1314/p/12391858.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!