第十周
一、火车浏览器
结合课程,了解并学习运用火车浏览器完成一个数据采集需求
此次练习我打算收集京东商城上有关iphone 11的相关数据
1.脚本的流程图
2.Xpath的运用
Xpath 是一门在 XML(eXtensible Markup Language) 文档中查找的语言。FirePath是Firefox提供的一个Xpath分析工具,需要配合firebug使用。
在火车浏览器中,想要提取网页中的数据,需要运用到Xpath。就例如下面:
3.结果
后期需要将数据提取为Excel表格,由于数据库这方面的知识还没有学,结果就先这样了。
4.总结:通过学习,我觉得火车浏览器和后羿采集器有一些相似之处,可以用以前对后羿采集器的理解来学习火车浏览器。学习了两种数据采集的方法,对这方面有更进一步的了解。
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
原文:https://www.cnblogs.com/kuibaone/p/12894669.html