Windows操作系统
1、各种教程-安装Python 解释器-3.7版本、IDE工具-Pycharm,
2、网络爬虫基本原理
①发起请求-,出发一个Resquest(请求方式(post/get、put/delete等))+Headers-键值对;
②获取响应内容-Response,类型包括HTML/json、二进制等;(Status状态码、响应头Response Headers、响应体-请求的资源响应)
③解析对应内容,使用正则、网页解析库、json、二进制对象等(解析库:BeautifulSoup / PyQuery XPath)
④保存数据,文本文件或数据库等
下一步学习:
文件读写操作:with open()
原文:https://www.cnblogs.com/bogepm/p/11333024.html