首页 > 其他 > 详细

scrapy框架

时间:2019-10-08 17:14:14      阅读:87      评论:0      收藏:0      [点我收藏+]

1.创建项目

1
scrapy startproject 项目名

1
scrapy startproject scrapyPro

2.进入项目,创建爬虫

cd 项目名
scrapy genspider 项目列表名 初始url(后面可以修改)

cd scrapyPro
scrapy genspider chouti chouti.com

3.展示爬虫应用列表

scrapy list

chouti

4.运行爬虫应用

scrapy crawl 爬虫应用名称

scrapy crawl chouti --nolog  #--nolog不打印日志

项目结构

project_name/
   scrapy.cfg  #项目的主配置文件
   project_name/
       __init__.py
       items.py  #设置数据存储模板,用于结构化数据:类似于Django中models
       pipelines.py  #数据处理行为:如数据的持久化
       settings.py  #配置文件:递归层数,并发数等
       spiders/  #爬虫目录,我们可以创建多个爬虫在此
           __init__.py
           爬虫1.py
           爬虫2.py
           爬虫3.py

 

scrapy框架

原文:https://www.cnblogs.com/xuezhihao/p/11636153.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!