首页 > 其他 > 详细

scrapy-redis

时间:2019-07-20 23:30:51      阅读:153      评论:0      收藏:0      [点我收藏+]

1.请求对象的持久化

2.去重指纹的永久化

所有请求对象、去重指纹均存储在redis中,而不是在内存中,断电/关机即消失,如果第一次请求未完成,第二次需要重新请求全部。

3.实现分布式

所有的服务器公用一个redis中的request对象

流程图:

技术分享图片


在项目中settings.py中配置:

RedisPipeline:配置所请求的数据存储在redis中,

RFPDupeFilter:配置指纹存储在redis中,

Scheduler:配置调度器,所有request对象存储在redis中

  • RedisPipeline

    redis中数据以列表存储

  • RFPDupeFilter

scrapy-redis

原文:https://www.cnblogs.com/justaman/p/11219457.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!