首页 > 其他 > 详细

02 scrapy 入门

时间:2019-10-17 16:56:58      阅读:50      评论:0      收藏:0      [点我收藏+]

1. 创建项目

  • 创建项目
    • scrapy startproject tutorial
  • 创建spider
    • cd tutorial
    • scrapy genspider quotes quotes.toscrape.com
  • 创建item
    • class QuoteItem(scrapy.Item):
      • text = scrapy.Field()
  • 解析response
    • 在parse函数中解析response
    • response.xpath( ‘//xpath表达式‘ ).extract_first()
  • 使用item
    • 声明的时候需要先实例化, 然后依次用刚才解析的结果赋值item的每一个字段, 最后将item返回即可 yield item
  • 后续request  
    • yield scrapy.Request(url=url, callback=self.parse)    
  • 运行:
    • scrapy crawl quotes
    • scrapy crawl quotes -o quotes.json  / 保存到指定文件   txt csv json                                        

02 scrapy 入门

原文:https://www.cnblogs.com/zhangjian0092/p/11693083.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!