首页 > 编程语言 > 详细

用Python写了个抓图小脚本

时间:2015-07-20 10:47:34      阅读:244      评论:0      收藏:0      [点我收藏+]

看上这个网页上一张图了,可惜他没有提供右键另存为,看了下网页代码,是可以找到图片原始链接的!但是因为没法和现实的图片一一对应,图又多,所以找起来还是麻烦。。。然后,我就想用 Python 把他们全部拉下来再找了。

下面是代码:

#coding=utf-8

import urllib
import re

def downloadPage(url):
    h = urllib.urlopen(url)
    return h.read()

def downloadImg(content):
    pattern = rhref="(.+?\.jpg)" class
    m = re.compile(pattern)
    urls = re.findall(m, content)

    for i, url in enumerate(urls):
        print url
        urllib.urlretrieve(url, "%s.jpg" % (i, ))

content = downloadPage("http://www.viajesalazul.com/holiday/lo-mejor-de-portugal-11-dias/")
downloadImg(content)

话说,学了正则表达式 要常常练习啊,恩,代码有借鉴另一作者的(代码放硬盘里好久了,原始作者已无从查找),自己改了下正则表达式。

 

用Python写了个抓图小脚本

原文:http://www.cnblogs.com/pied/p/4660674.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!