机器学习——小白学习Linux（二）爬取并保存图片

时间：2020-04-29 11:47:12 阅读：76 评论：0 收藏：0 [点我收藏+]

代码参考链接：https://www.cnblogs.com/chenyuan404/p/10192758.html

首先进入环境并cd 到指定文件夹下输入命令【vi food_pic.py】新建food_pic.py文件，进入编辑模式输入代码。输入命令【python food_pic.py】运行代码

分析网站

查看网页源代码

技术分享图片

通过正则表达式获取图片链接 re

 1 import requests
 2 import re
 3 from urllib import request
 4 
 5 
 6 #模拟浏览器获取图片链接
 7 def Get_PIC_list(keyword,max_page):
 8     all_picture_list = []
 9     for page in range(max_page):
10         page = page *30
11         url = ‘https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word={}&pn={}‘.format(keyword, page)
12         html = requests.get(url).content.decode(‘utf-8‘)
13         picture_list = re.findall(‘{"thumbURL":"(.*?)",‘,html)
14         all_picture_list.extend(picture_list)
15 
16     all_picture_list = set(all_picture_list)
17     download_picture(all_picture_list)
18 
19 #下载图片
20 def download_picture(all_picture_list):
21     for i,pic_url in enumerate(all_picture_list):
22         print(i)
23         string = ‘picture/{}.jpg‘.format(str(i + 1))
24         request.urlretrieve(pic_url, string)
25 
26 #开始函数
27 def start():
28     keyword = ‘美食照片‘
29     max_page = 2
30     Get_PIC_list(keyword,max_page)
31 
32 
33 if __name__ == ‘__main__‘:
34     start()

机器学习——小白学习Linux（二）爬取并保存图片

原文：https://www.cnblogs.com/cfancy/p/12800714.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)