首页 > 其他 > 详细

The Interpreter and ... 之 Source Code Encoding

时间:2015-03-03 23:46:52      阅读:492      评论:0      收藏:0      [点我收藏+]

在python的源代码文件中,允许使用不同的字符集编码而并非只是ASCII。最好的设置方法是在“#!”之后再多设置一个特殊的行,用来定义源代码文件的编码,就像下面这样:

# -*- coding: encoding -*-

通过上诉方式的定义,所有在源代码文件中的字符将都会被看做是(treated  as)指定的编码方式去编码,同时该源文件就允许立即被写入选中的编码的Unicode字符字面量。Python所允许的编码方式,你可以在Python的库参考中找到,在 codecs 这一章节中。

举个例子,为了在文件中可以使用包含“Euro currency symbol”(欧元货币符号)的Unicode字面量(literals),那么就可以使用 ISO-8859-15 编码方式,“Euro symbol”(欧元符号)的顺序值是 164。下面这个脚本的作用将会打印出8364这个值(“Euro symbol”对应的(corresponding)Unicode字符序号(codepoint)),然后退出:

# -*- coding: iso-8859-15 -*-
currency = u"€"
print ord(currency)

如果你的编辑器支持将文件存储成 UTF-8 编码格式,同时带有 UTF-8 的顺序标记(order  mark)(或者称做:BOM头),那么你就可以使用这种方式来代替编码方式定义的方式。


-----------待续。。。。

The Interpreter and ... 之 Source Code Encoding

原文:http://my.oschina.net/u/1156660/blog/382294

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!