首页 > Web开发 > 详细

01 lucene基础 北风网项目培训 Lucene实践课程 索引

时间:2017-02-27 20:35:35      阅读:248      评论:0      收藏:0      [点我收藏+]

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

在创建索引的过程中IndexWriter会创建多个对应的Segment,这个Segment就是对应一个实体的索引段。随着索引的创建,Segment会慢慢的变大。为了提高索引的效率,IndexWriter会把多个索引段(独立的索引段)合并成一个大的索引段。这样的话可以降低I/O操作的频率,可以提高检索的效率,这就是Lucene索引的创新之处。

技术分享

技术分享

通过IndexWriter和Directory的具体实现类可以控制索引的具体存储位置。

抽象类Analyzer有多个实现类,不同的实现类切词的效果是不一样的。标准的分词器。会接触多个分词器,实现对应的分词操作。由于中文分词和英文分词的不同,在分词器中,Lucene对中文的支持比较有限,所以说以后对中文的分词需要依赖第三方的jar包来实现对中文分词的支持。

技术分享

01 lucene基础 北风网项目培训 Lucene实践课程 索引

原文:http://www.cnblogs.com/ZHONGZHENHUA/p/6475994.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!