hege 发表于 2015-12-25 08:39:03

Jcseg

欢迎加入运维网交流群:263444886  
  Jcseg是基于mmseg算法的一个轻量级开源中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了最新版本的lucene, solr, elasticsearch的分词接口, Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等!
  Jcseg-1.9.7:
  1. 词库优化:增加新词,去掉一些无用词,部分词条词性优化。
  2. 增加文章关键字提取:基于textRank算法。
  
  3. 增加文章关键短语提取:基于textRank算法。
  
  4. 增加文章关键句子/文章摘要提取:基于BM25+textRank算法。
  
  5. 增加jcseg-server模块:嵌入jetty,提供了一个高性能的服务器,给关键字提取,关键短语提取,关键句子提取,文章摘要提取,中文分词都提供了restful api,并且标准为json结果输出! jcseg%E5%88%86%E8%AF%8D%E6%9C%8D%E5%8A%A1%E5%99%A8-" target="_blank">[详细文档]
  
  6. 终端测试程序增加关键字/关键短语/关键句子/摘要提取测试项。
  
  1.9.7-release版本下载
  jcseg%E6%98%AF%E4%BB%80%E4%B9%88-" target="_blank">1.9.7开发帮助文档
  感谢大家的支持与关注,Happy Jcseg!
页: [1]
查看完整版本: Jcseg