首页 > 其他 > 详细

TeamWork#3,Week5,Performance Test of Crawlers

时间:2014-11-19 20:17:54      阅读:283      评论:0      收藏:0      [点我收藏+]

爬虫总体性能不错,能完成基本的网络数据爬取,没有功能上的缺陷。下图为饿了么网站商户信息爬取结果及原网站信息。

bubuko.com,布布扣

bubuko.com,布布扣

大部分信息是正确的,但也有一些错误。比如下图,小渝馆家常菜和渝码头川菜位置爬取错了。

bubuko.com,布布扣

bubuko.com,布布扣

再比如鑫蜀轩酒楼和久久丫的顺序错了。

 

bubuko.com,布布扣

bubuko.com,布布扣

quantity_sold这一项,有的没有数据,是网站标签的问题,不是爬虫问题。

bubuko.com,布布扣

我们会根据出现的问题,找出程序存在的错误,进一步完善爬虫程序。

TeamWork#3,Week5,Performance Test of Crawlers

原文:http://www.cnblogs.com/sixsix/p/4108855.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!