首页 > 其他 > 详细

(17)字符编码

时间:2016-03-03 19:07:05      阅读:238      评论:0      收藏:0      [点我收藏+]

* 编码概述
  python2默认编码是ascii
 
 
* 中文处理
    >>> name ="中国"
    >>> name
    Out[265]: ‘\xe4\xb8\xad\xe5\x9b\xbd‘ 
    看到一些读不懂的代码
   
    文件开头加上
    # -*- coding: utf-8 -*-
    或
    # coding:utf-8
   
    遇到字符串
    unicode_str = unicode(‘中文‘, encoding=‘utf-8‘)
    print unicode_str.encode(‘utf-8‘)
   
    遇到文件操作
    import codecs
    codecs.open(‘filename‘, encoding=‘utf8‘)
   
    sys.getdefaultencoding() 得到python解析器的编码
   
    改为解析器的编码:
   
    写在程序入口:
    import sys
    reload(sys)
    sys.setdefaultencoding(‘utf8‘)
   
    另一个方案是在python的Lib\site-packages文件夹下新建一个sitecustomize.py,内容为: Python代码

    # encoding=utf8

    import sys  
    reload(sys)
    sys.setdefaultencoding(‘utf8‘) 

(17)字符编码

原文:http://www.cnblogs.com/toby2chen/p/5239550.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!