首页 > 编程语言 > 详细

Python-bs4解析html

时间:2019-10-26 22:53:21      阅读:75      评论:0      收藏:0      [点我收藏+]

Beautiful Soup简介(简称bs4)

它是一个可以从HTML或XML文件中提取数据的Python库,它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档的方式,节省工作时间

 所有对象可以归纳为4种:

Tag:标签对象,例如<p class=”title”><b>yoyoketang</b></p>,这就是一个标签

NavigableString:字符对象,如:这里是我的微信公众号:yoyoketagn

BeautifulSoup:就是整个html对象

Comment:注释对象,如:!-- for HTML5 --,它其实就是一个特殊NavigableString

安装pip install beautifulsoup4

 

Python-bs4解析html

原文:https://www.cnblogs.com/python-lll/p/11745811.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!