JAVA中文切词_JAVA_编程开发_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 编程开发 > JAVA > JAVA中文切词

JAVA中文切词

 2015/5/12 15:41:50  lin358  程序员俱乐部  我要评论(0)
  • 摘要:因项目需要对中文进行切词,故找同事要了段代码,现记录下来,以便日后使用publicstaticStringdetailData(Stringtext)throwsIOException{StringreturnStr="";//创建分词对象Analyzeranal=newIKAnalyzer(true);StringReaderreader=newStringReader(text);//分词TokenStreamts=anal.tokenStream("",reader)
  • 标签:Java
因项目需要对中文进行切词,故找同事要了段代码,现记录下来,以便日后使用

public  static String detailData(String text) throws IOException{
  String returnStr = "";

  //创建分词对象
  Analyzer anal = new IKAnalyzer(true);
  StringReader reader = new StringReader(text);

  //分词
  TokenStream ts = anal.tokenStream("", reader);
  CharTermAttribute term = ts.getAttribute(CharTermAttribute.class);
  while(ts.incrementToken()){
  returnStr = returnStr + term.toString()+"#@@#";
  }
  reader.close(); 
  return returnStr;
  }

另:附件1和2放在lib中,附件3放在src根目录
  • IKAnalyzer3.2.3Stable.jar (1.1 MB)
  • 下载次数: 0
  • lucene-core-3.6.0.jar (1.5 MB)
  • 下载次数: 0
  • src根目录.zip (746 Bytes)
  • 下载次数: 0
发表评论
用户名: 匿名