爬虫:
客户端:
Web应用本质
APP
服务器:
URL -> API
自动程序(爬虫):
起始URL:
https://www.cnblogs.com/
下载源码:
<!DOCTYPE html> <html lang="zh-cn"> <head> <meta name="viewport" content="width=device-width, initial-scale=1"><meta charset="utf-8"> <title>博客园 - 开发者的网上家园</title> <meta name="k ...
--- 获取关键字,收录到数据库 -
-- 再获取其他URL,href
再继续访问......
服务器提供API,URL有个专有名词叫API
requests.post(...)
原文:http://www.cnblogs.com/yard/p/6272289.html