BeautifulSoup 的应用

时间：2020-04-05 23:29:54 阅读：90 评论：0 收藏：0 [点我收藏+]

# coding=utf-8
import re
import requests
import bs4

# 获取源代码
content = requests.get("http://www.qq.com").text
#print(content)
# 得到标准的xml的HML格式代码
soup = bs4.BeautifulSoup(content,‘lxml‘)
# print(soup.prettify())
# 获取title,link,p等的名字、内容
print(soup.title)
print(soup.title.name)
print(soup.title.string)
print(soup.head.title.string)
# print(soup.head)
print(soup.link)
print(soup.link[‘href‘])
print(soup.link[‘rel‘])
print(soup.p)
print(soup.p.string)
# 获取子节点
print(soup.p.contents)
# 获取父节点
print(soup.p.parent)

# 根据标签名、属性、内容查找文档
print(soup.find_all("ul"))

BeautifulSoup 的应用

原文：https://www.cnblogs.com/samtang/p/12639523.html

踩

(1)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)