首页 > 其他 > 详细

爬取今日新闻网的侧边栏

时间:2019-11-23 21:46:00      阅读:81      评论:0      收藏:0      [点我收藏+]

题目:爬取今日头条新闻网的左边侧栏,并且以csv为文件的形式保存

代码:

import io
import sys
import urllib.request
import pandas as pd
from pyquery import PyQuery as pq
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding=gb18030) #改变标准输出的默认编码
url = https://mini.eastday.com/jrdftt/
def get_Info(url):
    res=urllib.request.urlopen(url)
    htmlBytes=res.read()
    doc = pq(htmlBytes.decode(utf-8))
    res = doc(".channel-item span")
    t = [i.text for i in res]
    se = pd.Series(t)
    se.to_csv("列表.csv")

结果:

技术分享图片

 

 

爬取今日新闻网的侧边栏

原文:https://www.cnblogs.com/CJR-QYF/p/11919559.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!