首页 > 编程语言 > 详细

python 根据中文构造url的方法

时间:2014-02-12 00:28:40      阅读:911      评论:0      收藏:0      [点我收藏+]

python 在处理网页的时候通常需要自己构造url,如在浏览器中显示为bubuko.com,布布扣

实际浏览器载入的url是:

http://search.jd.com/Search?keyword=%E7%A7%BB%E5%8A%A8%E5%B8%A6%E5%BC%8F%E8%BE%93%E9%80%81%E6%9C%BA&enc=utf-8&book=y

这里涉及到url编码中文的问题


需要把中文转换为url编码,具体用到python urllib或者urllib2库,一下用urllib2实例

isn=raw_input(‘请输入关键字‘)

isn1=urllib2.quote(isn.decode(sys.stdin.encoding).encode(‘utf8‘))

url=‘http://search.jd.com/Search?keyword=‘+isn1+‘&enc=utf-8&suggest=0&book=y‘


具体红色部分用什么编码方式的具体分析,像京东的是utf8方式从url中也可以体现出来。百度的是gbk,其他的一般网站比如google就是utf8的。



参考链接:http://developer.51cto.com/art/201003/190800.htm



python 根据中文构造url的方法

原文:http://monkeyzhu.blog.51cto.com/5764358/1358147

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!