代码放在Github上了。https://github.com/lpe234/meizi_spider
获取(http://www.meizitu.com/)网站图片,并保存到本地文件夹(meizi_images)下。
python run_spider.py # 即可
1.必须使用Cookie,否则无法访问
2.访问频率限制(请求间隔2秒,可正常访问)
数据抓取练习
原文:http://my.oschina.net/lpe234/blog/425027