首页 > 编程语言 > 详细

Python 使用BeautifulSoup

时间:2021-08-20 09:15:39      阅读:29      评论:0      收藏:0      [点我收藏+]


pip install bs4
pip install lxml

BeautifulSoup 使用

from bs4 import BeautifulSoup

page_text=res.text
soup=BeautifulSoup(page_text,‘lxml‘)

数据解析方法:
soup.tagName: 返回文档中,第一次出现的tagName
soup.find()
|-soup.find(‘tagName‘) 等同于 soup.div
|-属性定位:
soup.find(‘div‘,class_/id/attr="mao")
soup.find_all(‘tagName‘) 符合所有标签

-select:
|- select(‘某种选择器(id,class,标签,……)‘),返回一个列表
|-层级选择器:
-soup.select(‘.mao>ul>li>a‘) >表示的是一个层级
-soup.select(‘.mao>ul a‘) 空格表示的多个层级


-获取标签之间的文本数据:
-soup.a.text/string/get_text()/soup.a[‘href‘]
-text/get_text():获取标签中所有的文本内容
-string: 只可以获取标签下面直系的文本内容

 

Python 使用BeautifulSoup

原文:https://www.cnblogs.com/wookong/p/15164335.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!