[原创]python爬虫之BeautifulSoup,爬取网页上所有图片标题并存储到本地文件

时间：2019-05-15 15:36:40 阅读：665 评论：0 收藏：0 [点我收藏+]

from bs4 import BeautifulSoup
import requests
import re
import os
r = requests.get("https://re.jd.com/search?keyword=%E6%B0%B4%E6%9E%9C%20%E7%BD%91&keywordid=44195495794&re_dcp=202m0QjIIg==&traffic_source=1004&test=1&enc=utf8&cu=true&utm_source=baidu-search&utm_medium=cpc&utm_campaign=t_262767352_baidusearch&utm_term=44195495794_0_32d58cbc7f0f40e08d64a09fbc8c95c4")
result = r.content
# print(result)
soup = BeautifulSoup(result,"html.parser")
# print(soup.script.text)
souptext = soup.find(type=‘text/javascript‘).text
# print(souptext)

pattern3 =re.compile(r‘\"ad_title_text\":\"(.*?\"),\"image_url\":\"(.*?\.(jpg|png))\"‘)
patternresult3 = pattern3.findall(souptext)
print(patternresult3)

j = 0
for i in patternresult3:
    j = j+1
    title = i[0].replace(‘ ‘,‘‘).replace(‘\"‘,‘1‘).replace(‘/‘,‘1‘)
    with open(os.getcwd()+‘\\jpg\\‘+title+str(j)+"."+i[2],"wb") as f: #在执行代码前,需要先创建一个jpg的目录,os.getcwd()用来获取当前目录
        f.write(requests.get("https://img1.360buyimg.com/n6/"+i[1]).content)

运行结果如下:

技术分享图片

[原创]python爬虫之BeautifulSoup,爬取网页上所有图片标题并存储到本地文件

原文：https://www.cnblogs.com/lelexiong/p/10869451.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)