scrapy框架-2-初始化工程

时间：2021-04-15 15:13:11 阅读：23 评论：0 收藏：0 [点我收藏+]

scrapy startproject ProName
- cd ProName
- scrapy genspider spiderName www.xxx.com :创建爬虫文件
- 执行：scrapy crawl spiderName

import scrapy


class FirstspiderSpider(scrapy.Spider):
    #name作为爬虫文件的唯一标识符
    name = ‘firstSpider‘
    #allowed_domains是可以通过的域名信息，如不需要可以注释掉
    allowed_domains = [‘www.xxx.com‘]
    发送请求的url列表
    start_urls = [‘http://www.xxx.com/‘,‘http://www.xxx.com/‘]

    #数据解析相关函数
    def parse(self, response):
        pass

scrapy框架-2-初始化工程

原文：https://www.cnblogs.com/yehua-night/p/14661540.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)