使用Python爬取煎蛋网妹纸图片

时间：2017-05-22 13:14:57 阅读：406 评论：0 收藏：0 [点我收藏+]

import urllib.request
import os
import os.path
import re

def dir(dir_name="images"):
    """设定图片保存目录,基于当前程序运行目录"""
    if os.path.isdir(dir_name):
        os.chdir(dir_name)
    else:
        os.mkdir(dir_name)
        os.chdir(dir_name)    

def saveImage(img, url):
    """保存图片方法"""
    respones = urllib.request.urlopen(url)
    image = respones.read()
    with open(img, "wb") as f:
        f.write(image)

def getURL():
    page_list = []
    """
    可使用列表推导式，这里主要是定义页面的数量，数量越多图片越多
    page_list = [i for i in range(min=1,max=65)]
    """
    for i in range(1,5):
        page_list.append(i)
    return page_list

def getResposen():
    """获取url并对url进行处理，然后保存图片"""
    page_list = getURL()
    for i in page_list:
        res = "http://jandan.net/ooxx/page-"+str(i)+"#comments"
        respones = urllib.request.urlopen(res)
        html = respones.read()
        html = html.decode("utf-8")
        jpg_url = re.findall(r‘<img src=.+?\.jpg‘, html)
        for j in jpg_url:
            s = "http://"+j.split(‘//‘)[1]
            saveImage(s.split("/")[-1],s)
        
dir()
getURL()
getResposen()

注：请在Python 3.6环境下运行

本文出自 “蓝色_风暴” 博客，请务必保留此出处http://270142877.blog.51cto.com/12869137/1928096

使用Python爬取煎蛋网妹纸图片

原文：http://270142877.blog.51cto.com/12869137/1928096

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)