首页 > 其他 > 详细

JE分词器

时间:2015-04-04 12:18:29      阅读:156      评论:0      收藏:0      [点我收藏+]
/*这段代码写的是JE分词器对于所输入的文本进行分词

* 这里还可以自己设定,分词的范围和单个词语,这样用户可以更加方便对想要

*处理的文本更加的灵活多变。

*这里我添加的例子是.addWord(“回首雅虎在中国”);

* */



这个截图是没有加入自己设定的分词内容时候的分词结果:

技术分享




加入自己定义分词内容后的截图:

技术分享




package analyzer;


import jeasy.analysis.MMAnalyzer;


public class JE {


public JE() {
// TODO Auto-generated constructor stub


try{
String test = "回首雅虎在中国走过的道路,从目录试的搜索到 " 
+"综合门户的网站,再回归到搜索,之后再一次抛弃简介的搜索" 
+ "引擎界面, 在主页上加入了门户元素,直至目前单独开辟搜"
+"索域名,将cn.yahoo主页定个位门户和论坛社区的结合"
+"体, 可以说雅虎走火了一条颇为曲折的道路,在这个过程"
+"中,不能说没有走出去的机会,但是自身的重重问题让雅虎一"
+ "次次与机会失之交臂,远的暂且不说只从雅虎和阿里巴"
+"巴联盟之后说起";

MMAnalyzer analyzer = new MMAnalyzer();
//这里还可以自己设定分词的每个单个的、词,这里我把”回首雅虎在中国“
//这几个字当做是一个词,那么显示出来的结果就是添加后样子
MMAnalyzer.addWord("回首雅虎在中国");
System.out.println(analyzer.segment(test, " | "));
}catch(Exception e){
e.printStackTrace();
}
}


public static void main(String[] args) {
// TODO Auto-generated method stub

JE je = new JE();

}


}

JE分词器

原文:http://blog.csdn.net/u012965373/article/details/44871557

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!