1. 创建项目
- 创建项目
- scrapy startproject tutorial
- 创建spider
- cd tutorial
- scrapy genspider quotes quotes.toscrape.com
- 创建item
- class QuoteItem(scrapy.Item):
- 解析response
- 在parse函数中解析response
- response.xpath( ‘//xpath表达式‘ ).extract_first()
- 使用item
- 声明的时候需要先实例化, 然后依次用刚才解析的结果赋值item的每一个字段, 最后将item返回即可 yield item
- 后续request
- yield scrapy.Request(url=url, callback=self.parse)
- 运行:
- scrapy crawl quotes
- scrapy crawl quotes -o quotes.json / 保存到指定文件 txt csv json
02 scrapy 入门
原文:https://www.cnblogs.com/zhangjian0092/p/11693083.html