.find_all(name,attrs,recursive,string,**kwargs)
name:对标签名称的检索字符串
attrs:对标签属性值的检索字符串,可标注属性检索
recursive:是否对子孙全部检索,默认为True
string <>....</>中字符串区域的检索字符串
soup.find_all(‘a‘)
寻找a标签
soup.find_all(‘a‘,‘b‘)
寻找a标签和b标签并作为列表复制
for tag in soup.find_all(True)
print(tag.name)
打印出所有的标签
import re #正则表达式库
for tag in soup.find_all(re.compile(‘b‘)):
print(tag.name)
以b开头的标签
soup.find_all(‘p‘,‘course‘)
打印p标签class属性为course的标签
soup.find_all(id=‘link1‘)
打印id=link1的属性的标签
soup.find_all(id=re.compile(‘link‘)
打印id中存在link如link,link1,link2......等等的标签
soup.find_all(‘a‘)
soup.find_all(‘a‘,recursive=False)
从soup根节点开始儿子节点无a标签
soup.find_all(string="Basic Python")
可以检索Basic Python
如果引入正则表达式库
soup.find_all(string=re.compile("python"))
可以检索出所有含有python的标签内部内容
原文:https://www.cnblogs.com/jbwen/p/12297369.html