首页 > 编程语言 > 详细

Python爬虫框架--Scrapy安装以及简单实用

时间:2019-05-07 20:46:27      阅读:149      评论:0      收藏:0      [点我收藏+]
 

scrapy框架

框架

? -具有很多功能且具有很强通用性的一个项目模板

环境安装:

 Linux:
?
       pip3 install scrapy
?
?
?
    Windows:
?
     a. pip3 install wheel
?
     b. 下载twisted http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
?
     c. 进入下载目录,执行 pip3 install Twisted?17.1.0?cp35?cp35m?win_amd64.whl
?
     d. pip3 install pywin32
?
     e. pip3 install scrapy

创建一个工程

? scrapy startprobject proName

cd proName

创建爬虫文件:

? scrapy genspider spiderName www.xxx.com

执行工程:

? scrapy crawl spliderName

持久化存储

? 基于终端指令:

? 只可以将parse方法的返回值存储

基于管道指令实现持久化存储的实现流程:

-数据解析
-封装item类
-实例化item类型的对象
-将解析到的数据依次存储封装到item类型的对象中
-将item提交到管道
-在管道中实现io操作
-开启管道

  

Python爬虫框架--Scrapy安装以及简单实用

原文:https://www.cnblogs.com/xinjie123/p/10827767.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!