首页 > Web开发 > 详细

Lucene.net

时间:2014-04-25 13:45:17      阅读:440      评论:0      收藏:0      [点我收藏+]

Lucene.net是Lucene的.net移植版本,是一个开源的全文检索引擎开发包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。开发人员可以基于Lucene.net实现全文检索的功能。

Lucen.net中不同的分词算法都对应不同的类,所有的分词算法都是从Analyzer类继承。

     一元分词算法:StandardAnalyzer是将英文按照空格,标点符号等进行分词

     二元分词算法:CJKAnalyzer是将每两个汉字算作一个单词

      基于词库的算法:庖丁解牛、盘古分词法等。

//Analyzer analyzer = new StandardAnalyzer();//一元分词
//Analyzer analyzer = new CJKAnalyzer();
Analyzer analyzer = new PanGuAnalyzer();
TokenStream tokenStream = analyzer.TokenStream("", new StringReader("开发人员可以基于Lucene.net实现全文检索的功能"));
Lucene.Net.Analysis.Token token = null;
while ((token = tokenStream.Next()) != null)//reader.Read()//只要还有词,就不返回null
{
    Console.WriteLine(token.TermText());//token.TermText()为当前分的词
}

需要在文档中添加Lucene.Net.dll,PanGu.Lucene.Analyzer.dll等开发包


Lucene.net,布布扣,bubuko.com

Lucene.net

原文:http://blog.csdn.net/ankeyuan/article/details/24464619

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!