Jcseg 1.9.9 发布,Maven 仓库上传+无痛安装与测试
欢迎加入运维网交流群:263444886 http://onexin.iyunv.com/source/plugin/onexin_bigdata/https://my.oschina.net/img/hot3.pngJcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene,solr和elasticsearch的分词接口!
Jcseg 1.9.9更新如下:
1. 上传到了maven中心仓库,依赖地址如下(终于特么上maven了,1.9.8已经同步到了maven中心仓库,1.9.9还在同步中):
* 1), jcseg (全部模块)
org.lionsoul
jcseg
1.9.9
* 2), jcseg-core:
org.lionsoul
jcseg-core
1.9.9
* 3), jcseg-analyzer (lucene或者solr):
org.lionsoul
jcseg-analyzer
1.9.9
* 4), jcseg-elasticsearch
org.lionsoul
jcseg-elasticsearch
1.9.9
* 5), jcseg-server (独立的应用服务器)
org.lionsoul
jcseg-server
1.9.9
2. JcsegTaskConfig更改构造方法如下:
JcsegTaskConfig() //不做任何内部初始化
JcsegTaskConfig(boolean autoLoad) //是否自动寻找配置文件
JcsegTaskConfig(String proFile) //指定配置文件初始化
JcsegTaskConfig(InputStream is) //指定输入流初始化
3. JcsegTaskConfig或者jcseg.properties中的词库路劲支持设置为null。
4. ADictionary词库基类增加如下载入词库方法:
load(File file) //从File中载入全部词条
load(String file) //从指定文件路劲中载入全部词条
load(InputStream is) //从输入流中载入全部词条
loadDirectory(String lexDir) //载入一个词库目录下的全部词条
loadClassPath() //从classpath中载入全部词条
5. jcseg-core-{version}.jar中自动打包了一份jcseg.properties和全部的词库,从此只需要jcseg-core-{version}.jar文件即可运行,无需任何依赖,同时也可以在jcseg-core-{version}.jar目录下存放一份jcseg.properties配置文件来自定义全部选项,例如:最大切分长度,自定义词库路径等。
6. 词库优化,增加一些新词条。
版本仓库地址:
https://github.com/lionsoul2014/jcseg
http://git.oschina.net/lionsoul/jcseg
页:
[1]