首页 > 其他 > 详细

BeautifulSoup 用法

时间:2018-04-15 20:14:22      阅读:230      评论:0      收藏:0      [点我收藏+]

一、标签选择器

1、子节点contents child(迭代器)

2、子孙节点 descendants(迭代器)

3、父节点 parent  

4、祖节点  parents

5、兄弟节点 next_siblings (下一个兄弟) previous_siblings(上一个兄弟)

二、标准选择器

1、find_all(name,attrs,recursive,text,**kwargs)

name

技术分享图片

attrs        

技术分享图片

技术分享图片

text

 

技术分享图片

2、find(name,attrs,recursive,text,**kwargs)

find返回单个元素,find_all返回所有元素

 技术分享图片

 技术分享图片

三、CSS选择器

通过select()直接传入css选择器就可以完成选择

 技术分享图片

获取属性

 技术分享图片

获取内容

技术分享图片

 

总结

推荐使用lxml解析库,必要是使用html.parser

l 标签选择器筛选功能弱但是速度快

建议使用find(),find_all()查询匹配单个结果或者多个结果

如果对CSS选择器熟悉建议使用select

l 记住常用的获取属性和文本值得方法

BeautifulSoup 用法

原文:https://www.cnblogs.com/zlel/p/8849069.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!