在使用Python爬取网页数据时,常常会出现网页的源码与实际显示的内容有出入的情况,当网页为动态网页时就会出现这种情况,下面用QQ音乐的某个页面举例如何使用Python爬取改网页数据:
网址:http://y.qq.com/#type=singer&mid=000GDDuQ3sGQiT&tab=album
使用Chrome打开网页,对照网页源码,源码中并无专辑相关内容。
打开开发者工具:
对照网页内容,在Sources下面的某个源码里面,发现类似专辑内容的文件,如下图。
右键复制链接地址,使用Python爬取这个链接的内容就可以啦。
原文:http://www.cnblogs.com/007wangkai/p/4359450.html