首页 > 其他 > 详细

在scrapy中利用Selector来提取数据

时间:2019-10-18 14:10:40      阅读:161      评论:0      收藏:0      [点我收藏+]

1、创建对象

  Selector类的实现位于scrapy.selector模块,创建Selector对象的时候,可以将页面的Html文档字符串传递给Selector构造器方法

2、选中数据

  调用Selector对象的xpath或者css方法(传入xpath或者css选择器表达式),可以选中文档中的某一部分

  xpath和css方法返回的是一个SelectorList对象,其中包含每个被选中部分对应的Selector对象,SelectorList支持列表接口,可以使用for循环迭代访问其中的每一个Selector对象

3、提取信息

  调用Selector或者SelectorList对象中的方法可以将选中的内容提取出来

    extract

      SelectorList对象的extract方法会把所有结果收集到一个列表返回给用户

    re

      利用正则表达式提取想要的内容

    extract_first

      返回第一个Selector对象调用extract方法的结果。通常SelectorList对象中只包含一个Selector对象的时候就会调用这个方法

    re_first

 

在scrapy中利用Selector来提取数据

原文:https://www.cnblogs.com/tulintao/p/11697940.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!