首页 > 其他 > 详细

xpath获取下一页,兄弟结点的妙用

时间:2018-03-29 19:38:19      阅读:707      评论:0      收藏:0      [点我收藏+]

第一页的情况:

技术分享图片

 

第四页的情况 :

 

技术分享图片文章的链接:  http://tech.huanqiu.com/science/2018-02/11605853_4.html

 

    从上面我们可以看到,如果仅仅用xpath获取下一页的链接 例如:  //div[@id="pages"]/a[@class="a1"][text()="下一页"]/@href     

就会在第四页的时候重复获取相同的链接,我们通过观察可以发现一些规律:

所在的页码是在与链接a标签同级的span标签里面,这个时候我们可以采用兄弟结点,来解决这个问题,

//div[@id="pages"]/span/following-sibling::a[text()!="下一页"]/@href

 

说明:

1  获取到span标签的下一个兄弟结点a标签  (following-sibling::a)

2  另它的text内容不为"下一页"  ([text()!="下一页"])

3  再取这个a标签的href属性  (@href)

 

这样在第四页的时候获取到的链接为Null , 就不会重复获取下一页的链接了

 

xpath获取下一页,兄弟结点的妙用

原文:https://www.cnblogs.com/haitianzhimen/p/8671806.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!