首页 > 其他 > 详细

scrapy工程创建及pycharm运行

时间:2017-07-05 01:02:28      阅读:1525      评论:0      收藏:0      [点我收藏+]

1.通过命令行创建scrapy工程项目
scrapy startproject (工程名)

scrapy startproject myxml

 

 

2.利用爬虫模板设置爬虫文件
在这个过程中我们可以先利用 scrapy genspider -l(小写的L)命令查看当前的爬虫模板
如:scrapy genspider -t 模板名 爬虫文件名 允许的域名

scrapy genspider -t xmlfeed myxmlspider sina.com.cn

注释:
scrapy genspider -l 查看当前可以使用的爬虫模板
scrapy genspider -t 创建爬虫文件

 

 

 

3.将scrapy工程项目导入到pycharm中

 


4.编写Item文件(items.py),定义需要关注的数据

import scrapy
class ..(scrapy.Item):
name = scrapy.Field()
email = scrapy.Field()
...

 

 

5.编写爬虫文件(如上面的myxmlspider.py)

 


6.编辑scrapy在pycharm的运行环境
在Run中选择Edit Configuration
点击"+"创建一个"Python"
相关配置如下:

技术分享


 

scrapy工程创建及pycharm运行

原文:http://www.cnblogs.com/xiaomingzaixian/p/7119160.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!