ASCII 编码,UNICODE 编码等Python 2.x 默认使用
ASCII编码格式
Python 3.x 默认使用UTF-8编码格式
ASCII 编码256 个 ASCII 字符ASCII 在内存中占用 1 个字节 的空间
8 个 0/1 的排列组合方式一共有 256 种,也就是 2 ** 8UTF-8 编码格式
UTF-8 字符,涵盖了 地球上几乎所有地区的文字UTF-8 是 UNICODE 编码的一种编码格式Python 2.x 默认使用
ASCII编码格式
Python 3.x 默认使用UTF-8编码格式
utf-8 编码来处理 python 文件# *-* coding:utf8 *-*
这方式是官方推荐使用的!
# coding=utf8
Python 2.x 中,即使指定了文件使用 UTF-8 的编码格式,但是在遍历字符串时,仍然会 以字节为单位遍历 字符串u,告诉解释器这是一个 unicode 字符串(使用 UTF-8 编码格式的字符串)# *-* coding:utf8 *-*
# 在字符串前,增加一个 `u` 表示这个字符串是一个 utf8 字符串
hello_str = u"你好世界"
print(hello_str)
for c in hello_str:
print(c)
原文:https://www.cnblogs.com/long5683/p/12660104.html