首页 > 其他 > 详细

scrapy爬虫的编写步骤

时间:2019-01-17 16:47:42      阅读:161      评论:0      收藏:0      [点我收藏+]

scrapy的步骤:
a.编写item,爬取的各个属性
b.编写spider,name 要和 scrapy crawl xxspider一致,里面编写parse的信息,就是xpath获取item的各个信息。同时获取下一个要爬取的url放入url_set()队列
c.pipeline,item的数据落地
d.setting的设置

4. 手写一个爬虫框架:
1.下载网页
2.过滤网页
3.数据落地

5. 手写一个建议爬虫的方法
1.下载网页
2.获取网页相关数据
3.数据落地
4.获取下一页地址
5.循环

scrapy爬虫的编写步骤

原文:https://www.cnblogs.com/dzhou/p/10283051.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!