学习已经有一周了,原本在做公众平台,但是遇到了问题,觉得还是应该把这些简单的东西先弄好。
今天决定写一个自己的网络爬虫,用来去下载图片,因为在网上看那么教程视频,有一个淘宝美眉的图片爬虫,
我就决定写一个这个不练习。
因为教程中的网址地址是连续的数字,但是现在已经不是这样了,所以需要更改。
我是直接找到了淘女郎那页
http://mm.taobao.com/search_tstar_model.htm?spm=719.1001036.1998089564.7.FtZuvJ
然后下面就有那些各个模特的对应主页,我复制一个
http://mm.taobao.com/self/aiShow.htm?spm=0.0.0.0.M9PY2O&userId=25115086
这里她们相同的就是
http://mm.taobao.com/self/aiShow.htm?
我想的就是,先下载那个淘女郎首页,然后在里面找http://mm.taobao.com/self/aiShow.htm?这个开头的,然后再打开依次打开这个找到的页面。
然后就有这种使用里面的网址就可以打开这个图片了。
<img src="http://img03.taobaocdn.com/sns_album/i3/T1E39XXcNxXXb1upjX.jpg">
第一步:先学习怎么下载主页的内容,并且去找到所有淘女郎的链接
原文:http://my.oschina.net/bxxfighting/blog/390295