首页 > 其他 > 详细

简单爬取腾讯新闻方法封装

时间:2020-01-10 12:12:53      阅读:142      评论:0      收藏:0      [点我收藏+]
import urllib.request
import re


def get_new_qq(url, pat, file):
    data = urllib.request.urlopen(url).read().decode("gbk", "ignore").strip()
    res = re.compile(pat).findall(data)
    with open(file, "w") as f:
        f.write(str(res))
        return res


if __name__ == __main__:
    url = "https://www.qq.com/?pgv_ref=1"
    pat = "<li><a .*>(.*)</a></li>"
    file = "../腾讯新闻.txt"
    print(get_new_qq(url, pat, file))

简单爬取腾讯新闻方法封装

原文:https://www.cnblogs.com/CesareZhang/p/12175054.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!