Python中的字符编码

时间：2019-05-27 20:13:41 阅读：119 评论：0 收藏：0 [点我收藏+]

Python解释器启动后，相当于启动了一个文本编辑器，读取文件中的内容到内存中。但与文本编辑器不同的是，Python解释器的目的不是为了显示文件内容，而是一条一条执行文件中的内容

计算机只认识数字0和1。人类使用的字符信息在计算机中就是以数字0和1进行存储的。所以，人类文字和计算机文字之间需要通过某以规则进行转换，这就是字符编码的作用。

字符编码就相当于一本密码本一样。没有密码本，人类是无法把计算机的数字0和1转换成其可以读懂的文字。

各个国家的文字不一样，所以会有不一样的“密码本”。如果用错“密码本”来解码，那么，就会出现“乱码”现象

unicode——兼容万国的编码，即“超级密码本”

UTF-8（Unicode Transformation Format-8）

简单的说，unicode是一个精通世界各国语言的大师。大师在记录时，用自己的一套专用密码本utf-8，简单、高效。

utf-8这本密码本兼容世界万国语言，但却各个国家自己的密码本不兼容。和各个国家密码本兼容的是unicode。

注意：内存中使用的是unicode，历史遗留问题……

用什么编码存（encode)就用什么编码解(decode)，推荐使用utf-8

原文：https://www.cnblogs.com/heroknot/p/10932745.html

踩

(0)

评论一句话评论（0）

分享档案

更多>