最近接触了个新东西——es数据库
这东西虽然被用的很多,但我是前些天刚刚接触的,发现其资料不多,学起来极其痛苦,写个文章记录下
导入库
from elasticsearch import Elasticsearch
启动起来
默认9200端口是数据库端口,因为要用python操作其它的图形化就省略了。这里不要太纠结于es的数据格式,它就是个大字典。
这里我们存的数据是在_source字段中的,_index比较重要,类似于mysql中的database,其它不用管都是自动生成。(这条是怎么搜索出来的看下面)
先创建数据库连接:
es_host = "127.0.0.1:9200"
es = Elasticsearch([es_host])
创建数据库:
es.indices.create(index="ip")
增加数据:
ip_body = {
"ip": "127.0.0.2",
"port": "81",
"finger": " weblogic",
"os": "windows",
"tag": "yidong",
"updateTime": ""
}
es.index(index="ip",body=ip_body)
增加的数据只要是字典格式就可以了,或者说json格式。但是最好不要使用复合json,
虽然存的时候没问题,但是查询时会有麻烦,我没解决,哪位大佬知道请告诉我。
删除
es.delete(index="ip",id="xxxxxx")
id就是查询到字典中的‘_id‘的内容
删除直接用id去索引比较方便,因为是唯一的16位字符组成的,这也是不建议自己设置id的原因
es.indices.delete(index="ip")
这样的话就直接删除数据库了
查找
这里是比较麻烦的点,对于用惯mysql的我是最恶心的地方!
首先我们看一下查找全部数据,类似于select *:
es.search(index=types, body={"query":{"match_all":{}}})
这样就是搜索全部数据的语句。
然后其它的搜索语句有很多组合方式,但我觉得都没啥实用的,我这里只用了模糊和复合搜索就实现了全部功能,可能以后大小于的搜索也会有用
其实这里搜索语句就是改变body中的内容,但格式很恶心,我们单独拿出来看看:
body= {
"query":{
"bool":{"must":[{"prefix": {"url":"127"}},
{"prefix": {"status":"2"}}]
}
}
}
es.search(index="ip", body=body)
这个body里首先要搜索"query"是固定格式,然后bool代表复合搜索,must代表条件必须(当然还有must not等),prefix代表模糊搜索,最后是搜索内容
在must里是一个list,list里嵌套模糊搜索的字典,当然可以在bool里加入其它条件,在条件里加入其它形式的搜索
很难受对吧。所以这种格式不能直接让前端传,你得加自己的处理函数。
而且这里不能搜索复合json中的值,语法会报错,我不知道如何解决。
更新
更新的格式也差不多,而且资料很少,我找到了一种解决方式,大家可以自由发挥。
利用painless(https://blog.csdn.net/u013613428/article/details/78134170/)是比较方便的,配合_id的唯一特性去修改值:
update_test={
"script": {
"lang":"painless",
"source": "ctx._source.tag=params.tag;",
"params":{"tag":"aaa","ip":"10.10.1.1"}
}
}
es.update(index="ip",id="xxxxxxx",body=update_test)
这里的script和"lang":"painless"都是固定格式
source字段中ctx._source是固定格式,代表搜索数据库中source字段,后接key名,=号后面params.key名很好理解
最后是要修改的params和值。
我这是快速上手的一个方式,具体的es原理没看,如果哪位大佬理解的比较深刻有更好的方式提供或有解决复合json的方案欢迎联系我!
原文:https://www.cnblogs.com/TJWater/p/14389787.html