61
Surfing-Segment是一个先进的文本分词工具,专门增强ik-analyzer。包含多个自定义词典,动态识别型号、同义词功能、elasticsearch插件等功能。显著的增强了对专业术语及复杂型号的分词精确度。是电商平台优化体验的理想选择。
Java
2个月前
12837797 ohos rs 1712458884
0
4个月前
8919053 indexea 1673024392
191
基于 NLP 技术实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
Java
6个月前
5187 lionsoul 1578914315
367
Friso 是使用 c 语言开发的一款开源的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,并且提供了php5, php7, ocaml, lua的插件实现
C
7个月前
5187 lionsoul 1578914315
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口
Java
7个月前
812591 tenlee 1578933525
7
可能是东半球hao用的elasticsearch(es)中文分词器插件
Java
11个月前
372841 lishilei0523 1599393053
38
盘古分词组件,Forked from Eaglet
C#
12个月前
5460443 baidu 1578992824
232
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能
1734999 mr xiaolong 1578958819
3
MMSegmentation 是一个基于 PyTorch 的语义分割开源工具箱。它是 OpenMMLab 项目的一部分
1年前
0
IK分词器,主要针对lucene进行支持,版本与lucene版本同步
Java
1年多前
138
基于HanLP自然语言处理包的elasticsearch分词器
Java
1年多前
5008798 detachina 1659674630
79
快速中文分词分析word segmentation
Java
1年多前
11
基于中文基础词库,并结合自定义词库进行分词的系统。 词库将持续进行更新,但2023年起语义理解为新研究方向。
PHP
接近2年前
1
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
2年多前
12 mirrors 1578989292
2
The IK Analysis plugin integrates Lucene IK analyzer (http://code.google.com/p/ik-analyzer/) into opensearch, support customized dictionary.
Java
2年多前

搜索帮助