首页 > Web开发 > 详细

初识Apache Lucene

时间:2017-06-19 14:04:01      阅读:249      评论:0      收藏:0      [点我收藏+]

最近因为工作需要,需要学习Lucene。没办法只能度娘了,了解一些其中的大概和思想。

1.什么是Lucene?简单点来说,就是一种搜索引擎技术,开源的、高度扩展的搜索引擎库。

映射关系

1.什么是全文检索?简单介绍下。

  举个例子,输入LUCENE,所有内容中含有LUCENE的文件都会被检测出来。

  技术分享

  LUCENE采用的就是倒排索引,来实现相关映射。

LUCENE架构设计

  盗用一张图来体现LUCENE的精髓。

  技术分享

 从图中可以看到。LUCENE使用主要体现在俩个步骤:

1 创建索引,通过IndexWriter对不同的文件进行索引的创建,并将其保存在索引相关文件存储的位置中。

2 通过索引查寻关键字相关文档

 

 

索引的创建

1.首先定义一个词法分析器。

  技术分享

参数中的Version.LUCENE_CURRENT,代表使用当前的Lucene版本,本文环境中也可以写成Version.LUCENE_40。

这里面使用的是标准的词法分析器,如果专门针对汉语,还可以搭配paoding,进行使用。

2.确定索引文件存储的位置。

技术分享

3.创建IndexWriter,进行索引文件的写入。

技术分享

4.进行内容写入,首先将内容存储在docuent中再将document写入。

技术分享

 

 

索引创建完毕后,就是需要查询索引了。

技术分享

 

 

 

  

初识Apache Lucene

原文:http://www.cnblogs.com/qiumeng/p/7048189.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!