首页 > 其他 > 详细

elasticsearch原理及简介

时间:2019-08-20 10:05:48      阅读:94      评论:0      收藏:0      [点我收藏+]

elasticsearch是什么:

  elasticsearch 简称es,是一款基于Lucene的分布式搜索和分析引擎。它由索引(index),类型(type),文档(document),字段(field)这些基本元素组成搜索系统。

    简单来说就是,当这种全文搜索的场景在使用数据库去搜索时,由于需要在所有数据中去找到对应的数据,那边就需要遍历数据库的所有数据,非常的占用数据库的资源,而且效率非常的低下。这款ES的搜索服务就是代替服务器处理这种全局搜索的场景的。至于它为什么适合这样的场景,就不得不提到它的一个索引规则:倒排索引。

 

倒排索引:

  倒排索引表中的每一项都包括一个属性值和具有该属性值的各记录地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,这种索引称为倒排索引。

    倒排索引中的索引对象是文档或者文档集合中的单词,用来存储这些单词在一个文档或者一组文档中的存储位置。

    倒排索引的关键要素是关键词,频度(词的出现次数),位置(出现在文档中的位置)。好比中华词典,用户可以根据知道对应的字或者拼音,定位到对应的页码找到对应的注解。不用一页一页的翻看查找。

   

  举个例子有2篇文章1和文章2:

  文章1:tom lives in zhej, i live in zhej too.

  文章2:he once lived in beijing.

  1.首先我们要取得两篇文章的关键词,第一步就是分解字符串,将其拆分成一个个单词。拆分后文章1:[tom][lives][in][zhej][i] [live] [in] [zhej] [too] 文章2:[he] [once] [lived] [in] [beijing]

  2.在取得关键词后,我们可以建立倒排索引了

    

  

 

elasticsearch原理及简介

原文:https://www.cnblogs.com/culushitai/p/11380978.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!