骞没蕴 发表于 2016-10-26 00:42:15

Jcseg 1.9.9 发布,Maven 仓库上传+无痛安装与测试

欢迎加入运维网交流群:263444886  http://onexin.iyunv.com/source/plugin/onexin_bigdata/https://my.oschina.net/img/hot3.png
  Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene,solr和elasticsearch的分词接口!
  Jcseg 1.9.9更新如下:
  1. 上传到了maven中心仓库,依赖地址如下(终于特么上maven了,1.9.8已经同步到了maven中心仓库,1.9.9还在同步中):
  
  * 1), jcseg (全部模块)
  
  
    org.lionsoul
  
    jcseg
  
    1.9.9
  

  
  * 2), jcseg-core:
  
  
    org.lionsoul
  
    jcseg-core
  
    1.9.9
  

  
  * 3), jcseg-analyzer (lucene或者solr):
  
  
    org.lionsoul
  
    jcseg-analyzer
  
    1.9.9
  

  
  * 4), jcseg-elasticsearch
  
  
    org.lionsoul
  
    jcseg-elasticsearch
  
    1.9.9
  

  
  * 5), jcseg-server (独立的应用服务器)
  
  
    org.lionsoul
  
    jcseg-server
  
    1.9.9
  

  
  2. JcsegTaskConfig更改构造方法如下:
  
JcsegTaskConfig()                   //不做任何内部初始化  
JcsegTaskConfig(boolean autoLoad)   //是否自动寻找配置文件
  
JcsegTaskConfig(String proFile)     //指定配置文件初始化
  
JcsegTaskConfig(InputStream is)     //指定输入流初始化
  
  3. JcsegTaskConfig或者jcseg.properties中的词库路劲支持设置为null。
  4. ADictionary词库基类增加如下载入词库方法:
  
load(File file)                 //从File中载入全部词条  
load(String file)               //从指定文件路劲中载入全部词条
  
load(InputStream is)            //从输入流中载入全部词条
  
loadDirectory(String lexDir)    //载入一个词库目录下的全部词条
  
loadClassPath()                 //从classpath中载入全部词条
  
  5. jcseg-core-{version}.jar中自动打包了一份jcseg.properties和全部的词库,从此只需要jcseg-core-{version}.jar文件即可运行,无需任何依赖,同时也可以在jcseg-core-{version}.jar目录下存放一份jcseg.properties配置文件来自定义全部选项,例如:最大切分长度,自定义词库路径等。
  6. 词库优化,增加一些新词条。
  
  版本仓库地址:
  https://github.com/lionsoul2014/jcseg
  http://git.oschina.net/lionsoul/jcseg
页: [1]
查看完整版本: Jcseg 1.9.9 发布,Maven 仓库上传+无痛安装与测试