首页 > 其他 > 详细

Scrapy-redis

时间:2019-03-02 23:15:39      阅读:163      评论:0      收藏:0      [点我收藏+]

scrapy-redis是一个基于redis的scrapy组件,通过它可以快速实现简单分布式爬虫程序,该组件本质上提供了三大功能:

  • scheduler - 调度器
  • dupefilter - URL去重规则(被调度器使用)
  • pipeline   - 数据持久化

1.用redis去重url

 

Scrapy-redis

原文:https://www.cnblogs.com/weidaijie/p/10463383.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!