本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理
以下文章来源于腾讯云 作者:村雨遥
( 想要学习Python?Python学习交流群:1039649593,满足你的需求,资料都已经上传群文件流,可以自行下载!还有海量最新2020python学习资料。 )
http
HyperText Transfer Protocol,超文本传输协议,一种发布和接收HTML页面的方法,默认端口80;
https
Hypertext Transfer Protocol Secure,http协议的加密版,在http下加入SSL层,默认端口443;
定义
Uniform Resource Locator,统一资源定位符;
组成:scheme://host:port/path/?query-string=xxx#anchor,除开英文字母、数字和部分符号外,其他都是%+16进制码进行编码;
scheme:访问协议,常为http、https及ftp;
host:主机/域名;
port:端口号;
path:查找路径;
query-string:查询字符串;
anchor:锚点,用于前端的页面定位;
get
只需要从服务器获取数据,而不会对服务器资源产生影响时所使用的方式;
post
向服务器发送数据如登陆操作、上传文件等,会对服务器资源产生影响时所采用的方式;
Cookie
由之前服务器通过Set-Cookies设置的一个HTTP协议;
Referer
表示浏览器之前访问的页面,可以认为是之前访问页面的链接将浏览器带到当前页面;
User-Agent
浏览器的身份表示字符串;
Python中常用的一个网络请求库,可用于模拟浏览器的行为,向指定服务器发送请求,同时也可以向服务器请求数据,然后将服务器返回的数据保存,这是Python3中自带的一个库,直接可以使用,不需要再安装;
本文总结了学习Python爬虫所需要的一些基础知识,通过学习,你将对爬虫的定义以及一些网络知识有所了解,为接下来进一步学习Python爬虫做好准备;
原文:https://www.cnblogs.com/aa1273935919/p/13994102.html