首页 > 其他 > 详细

BeautifulSoup 的应用

时间:2020-04-05 23:29:54      阅读:86      评论:0      收藏:0      [点我收藏+]
# coding=utf-8
import re
import requests
import bs4

# 获取源代码
content = requests.get("http://www.qq.com").text
#print(content)
# 得到标准的xml的HML格式代码
soup = bs4.BeautifulSoup(content,‘lxml‘)
# print(soup.prettify())
# 获取title,link,p等的名字、内容
print(soup.title)
print(soup.title.name)
print(soup.title.string)
print(soup.head.title.string)
# print(soup.head)
print(soup.link)
print(soup.link[‘href‘])
print(soup.link[‘rel‘])
print(soup.p)
print(soup.p.string)
# 获取子节点
print(soup.p.contents)
# 获取父节点
print(soup.p.parent)

# 根据标签名、属性、内容查找文档
print(soup.find_all("ul"))

BeautifulSoup 的应用

原文:https://www.cnblogs.com/samtang/p/12639523.html

(1)
(1)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!