首页 > 编程语言 > 详细

python 实现汽车之家车型数据爬虫

时间:2016-07-08 20:11:42      阅读:268      评论:0      收藏:0      [点我收藏+]

爬虫保存数据库的样子:

技术分享

详细数据在json_text字段里面

安装使用方法:

git clone https://github.com/shancang/spider.git 
pip install -r requirements.txt
mysql spider< sql/createTable.sql

修改配置

spider/config.py

# -*- coding: utf-8
#日志----------------------------------------
#日志目录
LOG_DIR= "/tmp/spider"
#日志级别:debug,info,warning,error,critical
LOG_LEVEL = "info"
#process-----------------------------------
#pid 文件
PID_FILE = "/tmp/spider/spider.pid"
#线程数量
THARED_NUMBER = 6
#数据库------------------------------------
DB_USER = "spider"
PASSWORD = "123456"
DB_HOST = "localhost"
PORT = "3306"
DB_NAME = "spider"

进程管理

python setup.py start #启动
python setup.py stop  #停止
python setup.py status # 查看运行状态

具体详细请移步

https://github.com/shancang/spider   

代码仅供学习交流,不得做商业使用,不得恶意使用,造成后果请自行负责。

本文出自 “运维笔记” 博客,转载请与作者联系!

python 实现汽车之家车型数据爬虫

原文:http://sandy521.blog.51cto.com/5728588/1812623

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!