首页 > 编程语言 > 详细

产品经理学Python-爬虫攻坚no.1

时间:2019-08-10 22:58:08      阅读:124      评论:0      收藏:0      [点我收藏+]

Windows操作系统

1、各种教程-安装Python 解释器-3.7版本、IDE工具-Pycharm,

2、网络爬虫基本原理

  ①发起请求-,出发一个Resquest(请求方式(post/get、put/delete等))+Headers-键值对;

  ②获取响应内容-Response,类型包括HTML/json、二进制等;(Status状态码、响应头Response Headers、响应体-请求的资源响应)

  ③解析对应内容,使用正则、网页解析库、json、二进制对象等(解析库:BeautifulSoup / PyQuery XPath)

  ④保存数据,文本文件或数据库等

 

下一步学习:

文件读写操作:with open()

 

产品经理学Python-爬虫攻坚no.1

原文:https://www.cnblogs.com/bogepm/p/11333024.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!