534 zhzhenqin 1652695725
54
Paoding分词器基于Lucene4.x
Java
10年前
59466 lizhengxian 1578915844
48
模仿锤子M1新出的BigBang功能,轻松分词,重新造句,基于讯飞分词SDK实现
372841 lishilei0523 1599393053
38
盘古分词组件,Forked from Eaglet
C#
11个月前
12 mirrors 1578989292
37
pkuseg-python:一个高准确度的中文分词工具包 pkuseg-python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率
Python
3年多前
5187 lionsoul 1578914315
36
elasticsearch便捷版本,集成了一些常用的插件
Java
4年多前
16979 ijz 1578915129
27
梁博在线分词pullword的perl客户端,支持直接结果以及返回一个分词词频的hash。
Perl
5年多前
12 mirrors 1578989292
27
中文词法分析(LAC) 中文分词(Word Segmentation)是将连续的自然语言文本,切分出具有语义合理性和完整性的词汇序列的过程
C++
3年多前
27
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
22
基于ik-analyzer分词器,在其基础上实现对不同版本的lucene兼容,ik-analyzer项目主页地址为:https://code.google.com/archive/p/ik-analyzer/
Java
4年多前
No enterprise avatar
21
仿照Sphinx for Chinese,基于sphinx 2.2.9版本,结合cppJieba分词系统,让sphinx支持中文
C++
4年多前
18
elasticsearch的ik分词器动态扩展词库
Java
接近10年前
16
利用IK分词器,扩展了solr4.7.2,luence4.7.2,拼音分词,基于IK2012FF,JDK1.6,
Java
8年前
143034 yanyiwu 1578919348
16
"结巴"中文分词的C++版本
C++
暂未更新
438805 eavnfor 1578923885
15
针对mmseg4j (1.10.0)的拓展,弥补了多处不足,分词,随心所欲
Java
4年前
12 mirrors 1578989292
13
CoreNLP 是斯坦福提供的一组用Java编写的自然语言分析工具

搜索帮助