首页 > 其他 > 详细

xpath--string(.)用法

时间:2020-02-12 00:31:14      阅读:151      评论:0      收藏:0      [点我收藏+]
from lxml import etree

html = ‘‘‘
    <li class="tag_1">需要的内容1
       <a>需要的内容2</a>
    </li>
‘‘‘

selector = etree.HTML(html)
contents = selector.xpath(‘//li[@class = "tag_1"]‘)
contents1 = selector.xpath(‘//li[@class = "tag_1"]‘)[0]
contents2 = contents1.xpath(‘string(.)‘)
contents3 = selector.xpath(‘//li[@class = "tag_1"]/text()‘)
print(contents)  # [<Element li at 0x2c55e88>]
print(contents1)  # <Element li at 0x2c55e88>
print(contents2)
print(contents3)

  输出结果

技术分享图片

 

 对于contents3的输出中带有‘\n‘,逗号等字符,我们可以用replace替换成我们想要的字符或空格,具体用法参考https://www.runoob.com/python/att-string-replace.html

xpath--string(.)用法

原文:https://www.cnblogs.com/1061321925wu/p/12297383.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!