首页 > 编程语言 > 详细

python3 获取header和data

时间:2019-06-09 16:30:11      阅读:222      评论:0      收藏:0      [点我收藏+]

一、headers的获取

就以博客园的首页为例:http://www.cnblogs.com/

打开网页,按下F12键,如下图所示:

技术分享图片

点击下方标签中的Network,如下:

技术分享图片

之后再点击下图所示位置:

技术分享图片

找到红色下划线位置所示的标签并点击,在右边的显示内容中可以查看到所需要的headers信息。

技术分享图片

技术分享图片

一般只需要添加User-Agent这一信息就足够了,headers同样也是字典类型;

user_agent = Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36 
headers = { User-Agent‘ : user_agent } 

 

二、data获取

以博客园登录界面为例:http://passport.cnblogs.com/user/signin?ReturnUrl=http%3A%2F%2Fwww.cnblogs.com%2F

按下F12键,如下图所示:

技术分享图片

点击Network,然后随意输入用户名和密码,点击登录可以看到如下图所示:

技术分享图片

博客园登录的data信息:

data={
    input1:"*******",
    input2:"*******",
    remember:"false"
}

以电驴下载网站为例:http://secure.verycd.com/signin?error_code=emptyInput&continue=http://www.verycd.com/

技术分享图片

data信息在From Data标签中:

技术分享图片
data={
    username:"****",
    password:"****",
    continue:"http://www.verycd.com/"
    fk:" ",
    save_cookie:1,
    login_submit:"登录"
}
技术分享图片

每一个登录网站的data信息不一定一样,都需要进入网页确定。

好啦,今天就到这了~明天介绍一个实例:如何爬取糗百的段子。

转载时注明原作者出处:Maple2cat|Python爬虫学习:四、headers和data的获取

python3 获取header和data

原文:https://www.cnblogs.com/xinguichun/p/10993800.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!