首页 > 移动平台 > 详细

python爬取手机归属地

时间:2016-11-25 17:27:03      阅读:310      评论:0      收藏:0      [点我收藏+]
用python+bs4爬取了手机归属地数据:
 
import urllib.request
from bs4 import BeautifulSoup

def spider1(url):

    headers = {User-Agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11,
    Accept:text/html;q=0.9,*/*;q=0.8
    }

    opener = urllib.request.build_opener()
    opener.addheaders = [headers]

    source_code=opener.open(url).read()
    soup=BeautifulSoup(source_code,"html.parser",from_encoding="gbk")
    for link in soup.find_all(dd):
        baseurl=rhttp://guisd.com+link.a[href]+rall/
        haoduan=link.a.text
        print(haoduan)
        source_code=opener.open(baseurl).read()
        soup=BeautifulSoup(source_code,"html.parser",from_encoding="gbk")
        for tabb in soup.find_all(tr)[1:]:
            for tdd in tabb.find_all(td)[0:6]:
                f.writelines(tdd.get_text()+,)
            f.writelines(\n)         
f=open(text.txt,w+)
spider1(http://guisd.com/lb/)
f.close()

最终效果如下:

技术分享

python爬取手机归属地

原文:http://www.cnblogs.com/stephen2016/p/6101978.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!