首页 > 编程语言 > 详细

python爬虫笔记

时间:2015-03-22 23:53:20      阅读:386      评论:0      收藏:0      [点我收藏+]

把一个网站的html代码打印出来

第一种
improt urllib2

url=‘http://www.baidu.com‘
a=urllib2.urlopen(url)
b=a.read()
print b

 

第二种

通过Request对象来映射要打开的地址

import urllib2

a=urllib2.Request(‘http://www.baidu.com‘)

b=urllib2.urlopen(a)

c=b.read()

print c

 

 urlopen所产生对象的两种重要方法

 

1geturl()#得到原始地址,可能与最初的url不一样

2info()#得到相关信息

 

import urllib2

a=urllib2.Request(‘http://www.baidu.com‘)

b=urllib2.urlopen(a)

c=b.read()

print c

print b.geturl()

print b.info()

 

python爬虫笔记

原文:http://www.cnblogs.com/hitxx/p/4358197.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!