首页 > 编程语言 > 详细

python3 输出中文、日文等等乱码问题的解决办法

时间:2020-01-09 16:04:47      阅读:649      评论:0      收藏:0      [点我收藏+]

例如:

url = https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089
resp = requests.get(url=url)
html = etree.HTML(resp.text)
title = html.xpath(//div[@id="item-intro"]/h1/text())[0]
print(title)

打印结果为:

?A???e?B?[?N ?u???b?N ?J?E???U?[  / MA-1 ???U?[ ?u???]??

以上打印结果为乱码,解决办法:

1 先获取网址的编码:

url = https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089
resp = requests.get(url=url)
encodings = requests.utils.get_encodings_from_content(resp.text)
print(encodings)

结果为:

[Shift_JIS]

由此可知网站的编码是[‘Shift_JIS‘]

2 将获取的response.conetent的编码设置为[‘Shift_JIS‘],再次请求,获取到的就不是乱码了。

url = https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089
resp = requests.get(url=url)
resp_txt = resp.content.decode(Shift_JIS)
html = etree.HTML(resp_txt)
title = html.xpath(//div[@id="item-intro"]/h1/text())[0]
print(title)

结果为:

アンティーク ブラック カウレザー  / MA-1 レザー ブルゾン

python3 输出中文、日文等等乱码问题的解决办法

原文:https://www.cnblogs.com/loren880898/p/12171712.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!