首页 > 其他 > 详细

爬取豆瓣电影

时间:2019-09-24 22:22:26      阅读:113      评论:0      收藏:0      [点我收藏+]
  1. 代码
    # _*_ coding::utf_8 _*_
    import re
    import urllib.parse
    import urllib.request
    url=https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%A7%91%E5%B9%BB&sort=rank&
    # page=int(input("请输入要查询的页数:"))
    formdata={
    page_limit:30000,
    page_start:(2-1)*30,
    }
    headers={
    user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36,
    }
    formdata=urllib.parse.urlencode(formdata)
    url=url+formdata
    request=urllib.request.Request(url=url,headers=headers)
    response=urllib.request.urlopen(request).read().decode()
    print(response)
    film={}
    film[name]=re.findall(r"title":"(.*?)","url":,response)
    # film[name]=re.sub(r"title":"([A-Za-z0-9\!\%\[\]\,\。])","url":"https:\\/\\/movie.douban.com\\," ",response)
    print(film[name])

     

  2. 补充

爬取豆瓣电影

原文:https://www.cnblogs.com/ybl20000418/p/11581510.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!