首页 > 其他 > 详细

热点排名信息获取

时间:2020-03-21 20:06:01      阅读:65      评论:0      收藏:0      [点我收藏+]
import requests
from lxml import etree
#爬取知乎热度的前十名
headers = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 Edge/18.18362‘}
url =  "https://tophub.today/" 
response = requests.get(url,headers = headers) #发送get请求
html = etree.HTML(response.text) #构建一个xpath解析对象
a = html.xpath(".//span[@class=‘t‘]/text()")[50:60] #利用正则表达,爬取知乎排名前十名的标题
b = html.xpath(".//span[@class=‘e‘]/text()")[50:60] #利用正则表达,爬取知乎排名前十名的热度
for i in range(0 , len(a)):
    print("排名:{}--标题:{}------热度:{}".format(i+1,a[i],b[i])) #数据可视化

  技术分享图片技术分享图片

热点排名信息获取

原文:https://www.cnblogs.com/FFDXMM/p/12541667.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!