首页 > 其他 > 详细

动态渲染页面爬取-Selenium & Splash

时间:2019-04-26 18:48:29      阅读:684      评论:0      收藏:0      [点我收藏+]

模拟浏览器的动机

  • JS动态渲染的页面不止Ajax一种
  • 很多网页的Ajax接口含有加密参数,分析其规律的成本过高

通过对浏览器运行方式的模拟,我们将做到:可见即可爬
Python中常用的模拟浏览器运行的库为Selenium和Splash

Selenium

Selenium是一个自动化测试工具,可以用来控制浏览器行为

  1. QuickStart:https://seleniumhq.github.io/selenium/docs/api/py/
  2. 完整文档:https://www.seleniumhq.org/docs/
  3. Python接口:https://seleniumhq.github.io/selenium/docs/api/py/api.html

动态渲染页面爬取-Selenium & Splash

原文:https://www.cnblogs.com/lokvahkoor/p/10775897.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!