获取百度的热点前十名的标题信息及热度数据

时间：2020-03-21 20:11:00 阅读：54 评论：0 收藏：0 [点我收藏+]

#页面结构

技术分享图片

#源代码

import requests
from bs4 import BeautifulSoup
import bs4
import re

def getHTMLText(url):
try:
kv = {‘user-agent‘:‘Mozilla/5.0‘}
r = requests.get(url, headers = kv, timeout = 30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return " "

def printList(ulist, html):
soup = BeautifulSoup(html, "html.parser")
title = re.findall(‘<a href.*? target="_blank".*?>(.*?)</a>‘, html)[3:13]
redu = re.findall(‘<td>(.*?)</td>‘, html)[0:10]

x = 0
print("{:^50}\t{:^5}".format(‘标题‘, ‘热度‘))
while x <= 11:
print("{:^50}\t{:^5}".format(title[x], redu[x]))
x = x + 1

def main():
uinfo = []
url = "https://tophub.today/n/Jb0vmloB1G"
html = getHTMLText(url)
printList(uinfo, html)

main()

#获取数据截图

技术分享图片

获取百度的热点前十名的标题信息及热度数据

原文：https://www.cnblogs.com/luowenfei/p/12541605.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)