首页 > 其他 > 详细

scrapy 工程目录介绍

时间:2020-09-26 09:12:53      阅读:50      评论:0      收藏:0      [点我收藏+]

一:创建工程项目        scrapy startproject python123demo

python123demo 外部目录

scrapy.cfg   部署scrapy爬虫的配置文件

python123demo/python123demo     scrapy框架的用户自定义python代码

__init__.py 初始化脚本 

items.py Items代码模板

middlewares.py  Middlewares代码模板

pipelines.py   pipelines代码模板

settings.py  Scrapy爬虫配置文件

spiders/ Spiders代码模板目录

 spiders下有 __init__.py  (初始文件)和__pycache__/(缓存目录)

二:创建demo爬虫             scrapy genspider demo python123.io

技术分享图片

 

 文件内容;

三:配置产生的spider爬虫   修改文件demo.py  

技术分享图片

 

 注意:demo应该放在spider文件夹下

四:执行:scrapy crawl demo  

结果会在spiders文件夹中多出demo.html

 

scrapy 工程目录介绍

原文:https://www.cnblogs.com/dingh/p/13733209.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!