首页 > 编程语言 > 详细

python——爬虫

时间:2017-01-11 09:16:07      阅读:239      评论:0      收藏:0      [点我收藏+]

爬虫:

  客户端:

    Web应用本质

    APP

  服务器:

    URL -> API

 

自动程序(爬虫):

  起始URL:

    https://www.cnblogs.com/

    下载源码:

<!DOCTYPE html>
    <html lang="zh-cn">
    <head>
        <meta name="viewport" content="width=device-width, initial-scale=1"><meta charset="utf-8">
        <title>博客园 - 开发者的网上家园</title>
        <meta name="k
        ...

     --- 获取关键字,收录到数据库 -

    -- 再获取其他URL,href

    再继续访问......

 

 

 

  服务器提供API,URL有个专有名词叫API

   requests.post(...)

python——爬虫

原文:http://www.cnblogs.com/yard/p/6272289.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!