Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种:
-
Tag
- print soup.title #<title>The Dormouse‘s story</title>
- 两个重要属性 name和attrs soup.title.name 输出标签名字 soup.title.attrs 输出标签属性
- soup.title.string输出标签内部文字
-
NavigableString
-
BeautifulSoup
-
Comment
http://cuiqingcai.com/1319.html暂时学到这里
Beautiful Soup学习
原文:http://www.cnblogs.com/thouger/p/5109230.html