首页 > 其他 > 详细

IKAnalyzer中文分词法

时间:2015-05-18 09:09:11      阅读:226      评论:0      收藏:0      [点我收藏+]
package my.IKAnalyzer;import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.io.IOException;import java.io.StringReader;import java.util.Vector;import org.wltea.analyzer.core.*;public class IKAnalyzerTest {public static Vector participle( String str ) { Vector str1 = new Vector() ;//对输入进行分词 try { StringReader reader = new StringReader( str ); IKSegmenter ik = new IKSegmenter(reader,true);//当为true时,分词器进行最大词长切分 Lexeme lexeme = null ; while( ( lexeme = ik.next() ) != null ) { str1.add( lexeme.getLexemeText() ); } if( str1.size() == 0 ) { return null ; } } catch ( IOException e1 ) { System.out.println(); } return str1;}public static void main(String[] args) throws IOException {File file = new File("F:\\workspace\\work\\src\\my\\IKAnalyzer\\IKTest.txt");FileReader fr = new FileReader(file);BufferedReader br = new BufferedReader(fr);String str = null;while((str = br.readLine())!=null) {Vector res = participle(str);for( int i=0; i<res.size(); i++) { System.out.print(res.get(i)+" "); } System.out.println();} br.close();}}

IKAnalyzer中文分词法

原文:http://blog.csdn.net/jlnwan/article/details/45796063

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!