首页 > 其他 > 详细

9、总 开启对与爬虫的学习

时间:2021-01-03 10:37:48      阅读:24      评论:0      收藏:0      [点我收藏+]

python 爬虫

爬虫:对网络数据提取的一种艺术手法

一个正常的爬虫流程是什么样子?

1、将代码伪装成一个用户正常操作使用的浏览器
2、利用伪装代码向服务器发送请求,并成功接受返回结果
3、分析返回结果,提取数据
4、重复2-3,直到达成目的

那么该如何伪装代码?

如何判断伪装代码是否成功?

在大量重复提交测试中,伪装的代码是否能成功?

遇到了重定向,返回结果是否为自己所需要的?

静态页面与动态页面所需要的伪装方式是否相同?

...

技术分享图片

所列部分为目前能想到的情况,持续学习中...

9、总 开启对与爬虫的学习

原文:https://www.cnblogs.com/hefany/p/14224802.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!