首页 / SOLR / Solr入门之（8）中文分词器配置

Solr入门之（8）中文分词器配置

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Solr入门之（8）中文分词器配置，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2917字，纯文字阅读大概需要5分钟。

内容图文

Solr中虽然提供了一个中文分词器,

但是效果很差 "Times New Roman";‘>,可以使用"Times New Roman";‘>IKAnalyzer或"Times New Roman";‘>Mmseg4j 或其他中文分词器。

一、IKAnalyzer分词器配置：

1、下载IKAnalyzer（IKAnalyzer2012_u6）包,当前使用版本IKAnalyzer2012_u6.jar

2、将IKAnalyzer2012_u6包下的IKAnalyzer.cfg.xml和stopword.dic复制到solr应用/WEB-INF/classes下。

3、在${solr_home}/[core路径下]/conf/schema.xml中增加一个自定义fieldType：

<!-- 中文IK分词 --><fieldType name="text_ik_analyzer" positionIncrementGap="100" class="solr.TextField"><analyzer type="index"><tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"/><filter class="solr.StopFilterFactory" enablePositionIncrements="true" words="stopwords.txt" ignoreCase="true"/><filter class="solr.WordDelimiterFilterFactory" splitOnCaseChange="1" catenateAll="0" catenateNumbers="1" catenateWords="1" generateNumberParts="1" generateWordParts="1"/><filter class="solr.LowerCaseFilterFactory"/><filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/><filter class="solr.RemoveDuplicatesTokenFilterFactory"/></analyzer><analyzer type="query"><tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"/><filter class="solr.SynonymFilterFactory" ignoreCase="true" expand="true" synonyms="synonyms.txt"/><filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/><filter class="solr.WordDelimiterFilterFactory" splitOnCaseChange="1" catenateAll="0" catenateNumbers="0" catenateWords="0" generateNumberParts="1" generateWordParts="1"/><filter class="solr.LowerCaseFilterFactory"/><filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/><filter class="solr.RemoveDuplicatesTokenFilterFactory"/></analyzer></fieldType>

4、在schema.xml中增加一个字段：

<field name="test_ik_field" type="text_ik_analyzer" indexed="true" stored="true" termVectors="true" termPositions="true" termOffsets="true"/>

5、启动solr应用,即可在客户端界面查看分词效果。

二、Mmseg4j分词器：

配置方式与上面类似,暂时未定义。

原文：http://www.cnblogs.com/tq03/p/3607964.html

内容总结

以上是互联网集市为您收集整理的Solr入门之（8）中文分词器配置全部内容，希望文章能够帮你解决Solr入门之（8）中文分词器配置所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1124998.html

来源：【匿名】

【上一篇】solr添加中文IK分词器,以及配置自定义词库【下一篇】solr主从集群2

更多 ►

【Solr入门之（8）中文分词器配置】教程文章相关的互联网学习教程文章

第二步solr配置中文分词IK Analyzer【代码】【图】

1、下载IK Analyzer 2012FF_hf1.zip解压如下图：注解（IK Analyzer 2012才能支持solr4.0以上的版本）下载地址：http://pan.baidu.com/s/1c0nMOhE650) this.width=650;" src="/upload/getfiles/default/2022/11/14/20221114115016278.jpg" title="QQ截图20150121150425.png" />2、添加IK Analyzer 2012 FF 中文分词：把IKAnalyzer2012_FF文件夹IKAnalyzer2012_FF.jar放在tomcat1.6，webapps\solr\WEB-INF\lib的目录下，修改E:\solr\...

Solr7使用Oracle数据源导入+中文分词

oracle.jdbc.driver.OracleDriver" url="jdbc:oracle:thin:@192.168.2.218:1521:product " user="数据库用户名" password="数据库密码" /><document name=”product” pk=”主键”><entity name="bless" query="select * from bless"<--这里配查询语句--> deltaImportQuery="SELECT * FROM userinfo where UserID=‘${dih.delta.spuid}‘" deltaQuery="select bless_id from bless where bless_time > ‘${dataimporter.last_index...

linux下solr7.5的安装与中文分词【代码】【图】

solr的安装 ??首先要保证我们的服务器是有java环境,这里我用的是jdk1.8,为了方便我们直接从官网下载最新的solr7.5 ??wget http://mirrors.hust.edu.cn/apache/lucene/solr/7.5.0/solr-7.5.0.tgz ??下载完成之后进行解压 tar -zxvf solr-7.5.0.tgz,如果一切顺利的话我们会在目录下看到我们的solr目录 ??完成之后进入solr目录的bin下, cd solr-7.5.0/bin/ 尝试使用命令启动./solr start 会发现启动失败??这是因为使用的是root用户所以...

入门 - 相关标签

入门编程入门基础教程

SOLR - 最热教程

阿里云linux服务器上部署系统记录（jdk...solr的安装配置（linux）【Nutch2.2.1基础教程之2.1】集成Nutch...llinux下solr7.7.2使用命令创建core mysql-太阳黑子solr未定义字段类型 Solr8.8安全控制，开启基本身份验证 SolrCloud怎样创建跟新索引信息 java – 使用solr索引和搜索MySQL macOS安装Solr并索引MySQL Solr之Windows+Solr5.5.0+JDK1.8+Tomca...

首页 / SOLR / Solr入门之（8）中文分词器配置

Solr入门之（8）中文分词器配置

内容导读

内容图文

内容总结

内容备注

内容手机端

【Solr入门之（8）中文分词器配置】教程文章相关的互联网学习教程文章

第二步solr配置中文分词IK Analyzer【代码】【图】

Solr7使用Oracle数据源导入+中文分词

linux下solr7.5的安装与中文分词【代码】【图】

配置 - 相关标签

入门 - 相关标签

SOLR - 最新教程

SOLR - 最热教程