ASCII
编码,UNICODE
编码等Python 2.x 默认使用
ASCII
编码格式
Python 3.x 默认使用UTF-8
编码格式
ASCII
编码256
个 ASCII
字符ASCII
在内存中占用 1 个字节 的空间
8
个 0/1
的排列组合方式一共有 256
种,也就是 2 ** 8
UTF-8
编码格式
UTF-8
字符,涵盖了 地球上几乎所有地区的文字UTF-8
是 UNICODE
编码的一种编码格式Python 2.x 默认使用
ASCII
编码格式
Python 3.x 默认使用UTF-8
编码格式
utf-8
编码来处理 python 文件# *-* coding:utf8 *-*
这方式是官方推荐使用的!
# coding=utf8
Python 2.x
中,即使指定了文件使用 UTF-8
的编码格式,但是在遍历字符串时,仍然会 以字节为单位遍历 字符串u
,告诉解释器这是一个 unicode
字符串(使用 UTF-8
编码格式的字符串)# *-* coding:utf8 *-*
# 在字符串前,增加一个 `u` 表示这个字符串是一个 utf8 字符串
hello_str = u"你好世界"
print(hello_str)
for c in hello_str:
print(c)
原文:https://www.cnblogs.com/long5683/p/12660104.html