首页 > 编程语言 > 详细

Python的应用领域

时间:2020-03-02 14:00:56      阅读:45      评论:0      收藏:0      [点我收藏+]

 

一、什么是网络爬虫

   爬虫是一个模拟人类请求网站行为的程序。可以自动请求网页、并数据抓取下来,然后使用一定的规则提取有价值的数据。

 

二、爬虫的种类

   网络爬虫按照系统结构和实现技术,大致可以分为以下几种类型:通用网络爬虫(General Purpose Web Crawler)、聚焦网络爬虫(Focused Web Crawler)、增量式网络爬虫(Incremental Web Crawler)、深层网络爬虫(Deep Web Crawler)。

 

三、工作原理

   搜索引擎网络爬虫的基本工作流程如下:

技术分享图片

第一步:抓取网页

第二步:数据存储

第三步:预处理

第四步:提供检索服务, 网站排名

Python的应用领域

原文:https://www.cnblogs.com/renleiblog/p/12395145.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!