约定:
版本为ES6.4
@:为未解决疑问标志
A:为答案
G:为预测答案,等待验证。
(1) Near RealTime(NRT):近实时。基于es的搜索在秒级别。
(2) Index (索引):包含一堆相似结构的文档数据。比如客户索引,商品索引,订单索引,索引有一个名称,一个index包含很多个document。
(3) Documents (文档): es的最小数据单元。一个document可以是一条客户数据,一条商品分类数据,一条订单数据,通常是JSON数据表示,每个index下的type中,都可以去存储多个document。一个document里面有多个field。每个field就是一个数据字段。
(4)当进行精确值查找时,
我们会使用过滤器(filters)。过滤器很重要,因为它们执行速度非常快,不会计算相关度(直接跳过了整个评分阶段)而且很容易被缓存。我们会在本章后面的
过滤器缓存 中讨论过滤器的性能优势,不过现在只要记住:请尽可能多的使用过滤式查询。
问题在两点
一、搜索方式,过滤算法,权重,TF IDF等
二、分片算法,索引等。
@为何使用prefix时,字段名对应值需要小写。
如:实际值为
{
"name": "Gene",
"age": "19"
}
查找语句为
{
"query": {
"prefix": {
"name": "g"
}
}
}
可以正确显示结果,若g为大写G则不能hit
@同上图示例索引,使用全文检索ene不能正确匹配Gene。
G:由于是默认分词系统,未加过滤器。ES无法正确匹配到“ene”单词。(就语言角度应该也不会提供一个不成单词的搜索。就像忘了汉字如何写也很难找到正确答案。)
@使用PUT添加时返回创建不成功。
A:创建只能用POST,修改使用PUT,在URL后添加ID
@PUT如何按照ID修改?
@如何选择插入索引时的分词器
X:注意使用PUT按照ID修改时,若只想修改name属性,同时需要添加其他属性,否则会只剩修改的那条。
@创建索引时添加的属性是在规定
Elasticsearch学习笔记
原文:https://www.cnblogs.com/Simon-M/p/9647790.html