UnicodeDecodeError: ‘gbk‘ codec can‘t decode bytes in position 381-382: illegal multibyte sequence
上面报错原因是 str.decode("gbk") ,str中包含了gbk无法解析的字符. 参考
可以选择忽略.
str.decode("gbk", "ignore")
在windows环境下,执行如下代码可以重现此问题:
scrapy shell "http://www.oschina.net/" str = resp.body str.decode("gbk")
原文:http://www.cnblogs.com/juedui0769/p/4902533.html