首页 > 其他 > 详细

Bs4 BeautifulSoup取值

时间:2018-12-01 21:15:44      阅读:204      评论:0      收藏:0      [点我收藏+]

原文网址:https://blog.csdn.net/u010244522/article/details/79627073

从网页获取HTML数据后,获取对应标签、属性的值

取值方法主要有以下几种:

1.通过标签名(tag)获取: tag.name        tag对应的type是<class ‘bs4.element.Tag‘>

2.通过属性(attrs)获取:tag.attrs

 

通过标签属性获取:    tag["class"]  或     tag.get("class")

 

获取对应的内容

1.    tag.string    获取当前标签的内容

2.    tag.get_text()    获取标签内所有的字符串

查找相应的内容

1.find_all(class_="class")    返回的是多个标签,格式为<class ‘bs4.element.ResultSet‘>

2.find(class_="class")    返回一个标签,格式是<class ‘bs4.element.Tag‘>

3.select_one()    返回一个标签,格式是<class ‘bs4.element.Tag‘>

4.select()    返回的是多个标签,格式为<class ‘bs4.element.ResultSet‘>

1和4是返回组标签(就算只有一个标签也是一组)

取值时需要先定位,定位是list(ResultSet)中的那个标签在取值

tag[0].string

使用    find_all()    不带条件查找,tag[0]["class"].string

Bs4 BeautifulSoup取值

原文:https://www.cnblogs.com/moying-wq/p/10050720.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!