首页 > 编程语言 > 详细

Python学习之实现自己的网络爬虫

时间:2015-03-23 13:41:22      阅读:190      评论:0      收藏:0      [点我收藏+]

        学习已经有一周了,原本在做公众平台,但是遇到了问题,觉得还是应该把这些简单的东西先弄好。

今天决定写一个自己的网络爬虫,用来去下载图片,因为在网上看那么教程视频,有一个淘宝美眉的图片爬虫,

我就决定写一个这个不练习。

        因为教程中的网址地址是连续的数字,但是现在已经不是这样了,所以需要更改。

我是直接找到了淘女郎那页

http://mm.taobao.com/search_tstar_model.htm?spm=719.1001036.1998089564.7.FtZuvJ

然后下面就有那些各个模特的对应主页,我复制一个

http://mm.taobao.com/self/aiShow.htm?spm=0.0.0.0.M9PY2O&userId=25115086

这里她们相同的就是

http://mm.taobao.com/self/aiShow.htm?

我想的就是,先下载那个淘女郎首页,然后在里面找http://mm.taobao.com/self/aiShow.htm?这个开头的,然后再打开依次打开这个找到的页面。

然后就有这种使用里面的网址就可以打开这个图片了。

<img src="http://img03.taobaocdn.com/sns_album/i3/T1E39XXcNxXXb1upjX.jpg">


第一步:先学习怎么下载主页的内容,并且去找到所有淘女郎的链接



Python学习之实现自己的网络爬虫

原文:http://my.oschina.net/bxxfighting/blog/390295

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!