首页 > 编程语言 > 详细

Python__Xpath模块

时间:2021-05-07 23:47:33      阅读:37      评论:0      收藏:0      [点我收藏+]
import requests
from lxml import etree   # 导入xpath

headers = {
    User-Agent:Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36
}

tree = etree.parse(./相关/test.html)
#定位标签
# print(tree.xpath(‘//div‘)) #定位指定的所有标签
#属性定位
# print(tree.xpath(‘//div[@class="tang"]‘))
#索引定位:索引是从1开始的
# print(tree.xpath(‘//div[1]‘))
#层级定位:/表示一个层级,//表示多个层级
# print(tree.xpath(‘//div[@class="tang"]/ul/li[4]/a‘))
# print(tree.xpath(‘//div[@class="tang"]//li[4]/a‘))


#内容提取:/text(),//text()
# print(tree.xpath(‘//div[@class="tang"]/ul/li[4]/a/text()‘)[0])
#取属性值:/@atrrName
# print(tree.xpath(‘//div[@class="tang"]/ul/li[4]/a/@href‘)[0])

 

Python__Xpath模块

原文:https://www.cnblogs.com/zhangyh-blog/p/14741941.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!