首页 > 编程语言 > 详细

python-scrapy环境配置

时间:2021-01-09 23:13:36      阅读:33      评论:0      收藏:0      [点我收藏+]

window下:

1.先安装well            pip install wheel

2.先下载twisted       网址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

3.安装twisted          pip install Twisted-20.3.0-cp38-cp38-win32.whl

4.安装pywin32        pip install pywin32

3.安装scrapy           pip install scrapy

linux下:

直接安装scrapy      pip install scrapy

 

创建爬虫项目MyProjectMovie

1.创建项目,以爬取https://www.1905.com/dianyinghao/为例    scrapy startproject MyProjectMovie

2.进入项目 cd MyProjectMovie

3.创建爬虫应用文件    scrapy genspider movie www.xxx.com

项目文件夹目录

技术分享图片

 

 

 4.movie.py文件修改

import scrapy


class MovieSpider(scrapy.Spider):
name = ‘movie‘
# allowed_domains = [‘www.xxx.com‘]
start_urls = [‘https://www.1905.com/dianyinghao/‘]

def parse(self, response):
print(response.text)
print(response)

5.settings文件配置

USER_AGENT = ‘Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36‘
ROBOTSTXT_OBEY = False
LOG_LEVEL = ‘ERROR‘

6.程序运行

scrapy crawl movie

 

python-scrapy环境配置

原文:https://www.cnblogs.com/shiyi525/p/14256542.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!