JSONPATH
我们在抓取的时候,可以访问一些网页的api接口,网站通过接口返回给我们的是json数据,这样就省去了我们用xpath取解析的麻烦,然而有时候这个接送数据量特别大,如汽车数据,每个汽车有两百多个信息,一下子给你返回十几辆车的信息,这个json数据量就比较大了,这个时候想要提取出有用的信息就需要一大堆的for循环, 不停的字典.get() 方法获取数据,比较麻烦,代码也不美观.这个时候我们就可以用jsonpath解决问题.
1. 先来熟悉一下jsonpath的操作符
2. jsonpath的函数
以上函数只有length函数返回整形, 其他方法返回的都是浮点型
3. 过滤器运算符
过滤器是用于筛选数组的逻辑表达式,一个典型的过滤器格式如下:[?(@.age > 18)], 其中@表示当前正在处理的项目.
可以使用逻辑运算符&&和||创建更复杂的项目,
字符串文字必须用单引号或者双引号括起来 如: [?(@.color == ‘blue‘ )] 或者 [?(@.color == "blue")]
4 实例
{
"store": {
"book": [
{
"category": "reference",
"author": "Nigel Rees",
"title": "Sayings of the Century",
"price": 8.95
},
{
"category": "fiction",
"author": "Evelyn Waugh",
"title": "Sword of Honour",
"price": 12.99
},
{
"category": "fiction",
"author": "Herman Melville",
"title": "Moby Dick",
"isbn": "0-553-21311-3",
"price": 8.99
},
{
"category": "fiction",
"author": "J. R. R. Tolkien",
"title": "The Lord of the Rings",
"isbn": "0-395-19395-8",
"price": 22.99
}
],
"bicycle": {
"color": "red",
"price": 19.95
}
},
"expensive": 10
}
在线测验网址: http://jsonpath.herokuapp.com/
$..book[?(@.price <= $[‘expensive‘])]
$..book[?(@.author =~ /.*REES/i)]
$..*
$..book.length()
------------恢复内容结束------------
原文:https://www.cnblogs.com/zhangjian0092/p/12144589.html