python爬虫学习之requests_01

时间：2019-06-27 21:33:17 阅读：131 评论：0 收藏：0 [点我收藏+]

---恢复内容开始---

1、Requests库的get()方法

　　requests.get(url,params=None,**kwargs)

　　　　url：拟获取页面上的url链接

　　　　params：url中的额外参数，字典或字节流格式，可选

　　　　**kwargs：12个控制访问的参数

import requests
r = requests.get(‘https://www.baidu.com‘)
#检测状态请求的状态码 200则成功，反之则失败
print(r.status_code)
#检测r的类型
type(r)
#返回get请求页面的头部信息
r.headers

　　Response对象的属性

技术分享图片

　　Response的编码

技术分享图片

　　r.encoding：如果header中不存在charset,则认为编码为ISO-8859-1

　　r.apparent_encoding：根据网页内容分析出的编码方式

　　Requests库的异常

技术分享图片

import requests
def getHTMLText(url):
    try:
        r = requests.get(url, timeout=30)
        r.raise_for_status()#如果状态不是200，则引发 HTTPError异常
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return ‘产生异常‘
if __name__ == ‘__main__‘:
    url = ‘http://www.baidu.com‘
    print(getHTMLText(url))

---恢复内容结束---

python爬虫学习之requests_01

原文：https://www.cnblogs.com/fb1704011013/p/11099610.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)