可简单爬取知乎上当前网页的图片，直接负责网址到url处，修改i的值即可（保存路径稍微改改）

时间：2021-04-19 23:21:55 阅读：26 评论：0 收藏：0 [点我收藏+]

import requests
import re
import time


def spider(url, headers):

    response = requests.get(url, headers=headers)
    pat1 = re.compile(r‘<noscript><img src="(.*?)"‘, re.S)
    url_list = pat1.findall(response.text)
    i = 64  # 待修改,修改i的值可给爬到的图片命名
    for url in url_list:
        result = requests.get(url, headers)
        with open(fr"C:\Users\marginal\Desktop\壁纸\{i}.jpg", "wb") as f:
            f.write(result.content)
        print(f"正在下载第{i}张图片")
        time.sleep(0.5)
        i += 1
    print("over")


def main():
    url = r‘https://zhuanlan.zhihu.com/p/164538508‘  # 待修改，给知乎上有图片的网站就能爬
    headers = {‘user-agent‘: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ‘
                             ‘Chrome/89.0.4389.114 Safari/537.36‘,
               }
    spider(url, headers)


if __name__ == ‘__main__‘:
    main()

原文：https://www.cnblogs.com/margin1314/p/14678418.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)