首页 > Web开发 > 详细

selenium中webdriver的局部HTML提取

时间:2016-03-24 02:22:56      阅读:243      评论:0      收藏:0      [点我收藏+]
      别和我说selenium中的webdriver用driver.page_source,我就是不想把整篇HTML文档每次都全部提出来做Soup。因为,对下面这样左右结构的论坛而言,每次内容的改变对于整个HTML页面而言实在是一个很小的部分,如果我想把整个网站所有MOOC课程评论爬下来的话,将要做多少无用功!
bubuko.com,布布扣
     然而,百度遍中文内容并无解答。于是翻出去Google了一把,发现世界上已有前辈对该问题进行了解答: 
bubuko.com,布布扣

     主要思路是使用get_attribute方法,提取innerHTML,如下:
bubuko.com,布布扣
     经验证,一切OK:
bubuko.com,布布扣

selenium中webdriver的局部HTML提取

原文:http://blog.chinaunix.net/uid-22414998-id-5678340.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!