5187 lionsoul 1578914315
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口
Java
6个月前
471
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包
Java
9年前
8919053 indexea 1673024392
191
基于 NLP 技术实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
Java
6个月前
138
基于HanLP自然语言处理包的elasticsearch分词器
Java
1年多前
5008798 detachina 1659674630
79
快速中文分词分析word segmentation
Java
1年多前
60
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java
6年多前
57
Surfing-Segment是一个先进的文本分词工具,专门增强ik-analyzer。包含多个自定义词典,动态识别型号、同义词功能、elasticsearch插件等功能。显著的增强了对专业术语及复杂型号的分词精确度。是电商平台优化体验的理想选择。
Java
1个月前
534 zhzhenqin 1652695725
54
Paoding分词器基于Lucene4.x
Java
10年前
5187 lionsoul 1578914315
36
elasticsearch便捷版本,集成了一些常用的插件
Java
4年多前
22
基于ik-analyzer分词器,在其基础上实现对不同版本的lucene兼容,ik-analyzer项目主页地址为:https://code.google.com/archive/p/ik-analyzer/
Java
4年多前
18
elasticsearch的ik分词器动态扩展词库
Java
接近10年前
16
利用IK分词器,扩展了solr4.7.2,luence4.7.2,拼音分词,基于IK2012FF,JDK1.6,
Java
8年前
438805 eavnfor 1578923885
15
针对mmseg4j (1.10.0)的拓展,弥补了多处不足,分词,随心所欲
Java
4年前
12 mirrors 1578989292
13
CoreNLP 是斯坦福提供的一组用Java编写的自然语言分析工具
7122 ysc 1578914462
13
Java开源项目cws_evaluation:中文分词器分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
Java
接近7年前

搜索帮助

14c37bed 8189591 565d56ea 8189591