首页 > 其他 > 详细

Scrapy 安装

时间:2015-06-12 16:40:57      阅读:126      评论:0      收藏:0      [点我收藏+]

1.安装 lxml (使用xpath)

2.安装 zope.interface

3.安装 twisted

   出错先安装 sudo apt-get install build-essential python-dev

4.安装 pyOpenSSL

5.安装 pywin32

6.安装Scrapy 

 windows需要安装vs linux需要安装g++

一  生成tutorial项目执行

      scrapy startproject tutorial

二  用pycharm打开项目在spiders文件夹下创建一个dmoz_spider.py

  

__author__ = ‘weilunhui‘

# import scrapy
from scrapy.contrib.spiders import CrawlSpider


class DmozSpider(CrawlSpider):
    name = "douban"
    start_urls = [
        "http://movie.douban.com/top250"
    ]

    def parse(self, response):
        print(response.body)

三 在tutorial 下(含有scrapy.cfg文件的地方)执行

      scrapy crawl douban     ("douban"是和上面的dmoz_spider.py里的name保持一致)

  运行结果会显示抓取下来的网页的内容

Scrapy 安装

原文:http://www.cnblogs.com/weilunhui/p/4571875.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!