11 Star 16 Fork 4

小龙 / analyzer-pinyin

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

##SOLR 4.7.2插件使用详情

#solr schema.xml的配置信息

	<!---->
		<fieldType name="text_pinyin" class="solr.TextField" positionIncrementGap="100">
	      <analyzer type="index">
		<tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="false"/>
		<filter class="org.apache.lucene.analysis.pinyin.solr4.PinyinTokenFilterFactory" pinyinAll="false" shortPinyin="true"  minTermLength="1" />
		<!-- in this example, we will only use synonyms at query time
		<filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>
		-->
			<!--
		<filter class="org.apache.lucene.analysis.pinyin.solr4.PinyinNGramTokenFilterFactory" nGramChinese="true" nGramNumber="true"/>
			-->
	      </analyzer>
		  
	      <analyzer type="query">
		<tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="false"/>
		<filter class="org.apache.lucene.analysis.pinyin.solr4.PinyinTokenFilterFactory" pinyinAll="false"  shortPinyin="true" minTermLength="1" />
		<!-- in this example, we will only use synonyms at query time
		<filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>
		-->
			<!--
		<filter class="org.apache.lucene.analysis.pinyin.solr4.PinyinNGramTokenFilterFactory" nGramChinese="true" nGramNumber="true"/>
			-->
	      </analyzer>
	    </fieldType>

##配置参数含义

shortPinyin是否启用简拼 默认不用简拼 值为false 如果启用简拼要设置pinyinAll的值为false
pinyinAll是否启用全拼+简拼 默认 是全拼加简拼
minTermLength汉字最小转换拼音长度 默认长度为2
isContainerNumber 如果分词中包含数字,是否拼音中也包含数字 默认值为包含
outChinese 是否输出汉字 默认输出true

空文件

简介

利用IK分词器,扩展了solr4.7.2,luence4.7.2,拼音分词,基于IK2012FF,JDK1.6, 展开 收起
Java
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
Java
1
https://gitee.com/lovert/analyzer-pinyin.git
git@gitee.com:lovert/analyzer-pinyin.git
lovert
analyzer-pinyin
analyzer-pinyin
master

搜索帮助