5187 lionsoul 1578914315
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene,solr和elasticsearch的搜索分词接口
12 days ago 9 issues
425
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包
almost 6 years ago 4 issues
107
基于HanLP自然语言处理包的elasticsearch分词器
almost 3 years ago
55
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
3 years ago
快速中文分词分析word segmentation
2 days ago 2 issues
7122 ysc 1578914462
51
Java中文分词组件 - word分词。本站是word分词在Github的镜像站点,仅做备份使用。
2 years ago
534 zhzhenqin 1578913818
47
Paoding分词器基于Lucene4.x
almost 7 years ago 1 issue
16
利用IK分词器,扩展了solr4.7.2,luence4.7.2,拼音分词,基于IK2012FF,JDK1.6,
over 4 years ago
438805 eavnfor 1578923885
15
针对mmseg4j (1.10.0)的拓展,弥补了多处不足,分词,随心所欲
10 months ago
7700 gavinguang 1578914509
11
RongRong分词,目前使用双向最大匹配算法。词库直接使用Jieba分词里面的词库。 此分词词库目前主要用在电商领域,以后打算做一个开源的电商词库。
7 years ago
7122 ysc 1578914462
11
Java开源项目cws_evaluation:中文分词器分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
over 3 years ago
10
elasticsearch的ik分词器动态扩展词库
over 6 years ago
971 zacker330 1578913918
8
Chinese analysis plugin which using IK analysis for Elasticsearch
None update
7
基于ik-analyzer分词器,在其基础上实现对不同版本的lucene兼容,ik-analyzer项目主页地址为:https://code.google.com/archive/p/ik-analyzer/
1 year ago
145212 gitclebeg 1578919448
4
自然语言分词模块,为中文语料批量分词,会继承各种分词工具
over 5 years ago

Search

132457 8cb2edc1 1899542 131848 70c8d3a4 1899542