Python解释器启动后,相当于启动了一个文本编辑器,读取文件中的内容到内存中。但与文本编辑器不同的是,Python解释器的目的不是为了显示文件内容,而是一条一条执行文件中的内容
计算机只认识数字0和1。人类使用的字符信息在计算机中就是以数字0和1进行存储的。所以,人类文字和计算机文字之间需要通过某以规则进行转换,这就是字符编码的作用。
字符编码就相当于一本密码本一样。没有密码本,人类是无法把计算机的数字0和1转换成其可以读懂的文字。
各个国家的文字不一样,所以会有不一样的“密码本”。如果用错“密码本”来解码,那么,就会出现“乱码”现象
unicode——兼容万国的编码,即“超级密码本”
UTF-8(Unicode Transformation Format-8)
简单的说,unicode是一个精通世界各国语言的大师。大师在记录时,用自己的一套专用密码本utf-8,简单、高效。
utf-8这本密码本兼容世界万国语言,但却各个国家自己的密码本不兼容。和各个国家密码本兼容的是unicode。
注意:内存中使用的是unicode,历史遗留问题……
用什么编码存(encode)就用什么编码解(decode),推荐使用utf-8
原文:https://www.cnblogs.com/heroknot/p/10932745.html