首页 > 其他 > 详细

爬虫推荐的工具

时间:2017-09-08 16:10:52      阅读:336      评论:0      收藏:0      [点我收藏+]

爬虫推荐的工具:
pyspider,
BeautifulSoup
requests
scrapy
mongodb
redis
kafka.
re
pyV8:python执行js的插件
phatomjs:一个无界面的,可脚本编程的WebKit浏览器引擎。它原生支持多种web 标准:DOM 操作,CSS选择器,JSON,Canvas 以及SVG
selenium:是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。

一开始推荐学习框架,比如scrapy或者Pyspider

数据分析:
pandas
scikit-learn
spark.
ntlk
jieba

pandas主要是处理金融数据得力,scikit-learn用来进行机器学习,spark是分布式计算。nltk进行予以分析。jieba用来做中文分词。

爬虫推荐的工具

原文:http://www.cnblogs.com/davidwang456/p/7494890.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!