首页 > 其他 > 详细

requests类库 作业总结

时间:2018-10-11 17:47:07      阅读:159      评论:0      收藏:0      [点我收藏+]

1,在用get方法时,可在网址后加一个问号?表示传递参数

例:repose=requests.get(‘http;//httpbin.org/get?name=germey&age=22‘)

2 ,也可在get中设置params参数(要求后面添加的参数为字典的形式)

例:repose=requests.get(‘http;//httpbin.org/getparams={‘name‘:‘germy‘,‘age‘=22}

3  ,在获取源代码得到的是杂乱无章的时候,可用josn,即名字.json或json.loads(名字.text)

4,用get方式获取图片时,如果直接用名字.text输出网页源代码时,得到的是乱码,要获取图片则要获取图片的二进制代码,可以用名字.content

(如何把网页上的图片爬取下来?在get网址后,用with open(‘新建一个文件名.图片后缀’,‘wb’)as**:      再用**.write(获取图片二进制源码的方式)

5,在爬取网页数据时,如若不被允许,可以仿造浏览器来爬取

6,请求要有请求头,有了请求头会更像是浏览器在访问数据,找到网页中F12的请求头代码,,创建一个变量,使得变量={‘请求头名’:‘请求头代码’}

7,在get获得网页时get(‘网址’,变量名=变量名)

8,状态码判断:在访问网络不成功时,可用exit()if not 名字.status_code==200

                              else print(‘Request Successful’)表示如果状态码为200访问不成功时,则退出,否则则输出Request Successful

9,如何把一个图片上传到网络?

设置一个变量为files,files={‘files’:open(‘图片名’,‘rb’)}

value值为操作系统open接口类型(上传文件,图片均用post)

名字=request.post(‘网址’,files=files)

10,访问网站出现不安全提示时,可用package下urllib3类库下的警告类库-------urllib3.disable_warnings()再用get访问(‘网址’,verify=False)

其中verify=False是指不要出现验证方式

11,访问超时的设置,可以设置访问时间超过多久就退出,用requests类库中Exception类,再导入Timeout

名字=requests.get(‘网址’,timeout=1)访问该网址超过1秒就停止,输出状态码

 

requests类库 作业总结

原文:https://www.cnblogs.com/ZHONGmy/p/9773727.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!