Solr6 6 IK 中文分詞的配置和使用

2021-09-08 13:49:30 字數 2614 閱讀 5450

或者存放solr-6.6.0\server\solr\test\lib下面,就是在核test下面建立lib資料夾,把對應元件放在lib下面

修改solrconfig.xml,增加如下:

3. 在 solr-6.6.0\server\solr\test\conf\managed-schema增加如下配置

<

fieldtype

name

="text_ik"

class

="solr.textfield"

>

<

analyzer

type

="index"

>

<

tokenizer

class

="org.wltea.analyzer.lucene.iktokenize***ctory"

usesmart

="false"

conf

="ik.conf"

/>

<

filter

class

="solr.stopfilte***ctory"

ignorecase

="true"

words

="lang/cnstopwords.txt"

/>

analyzer

>

<

analyzer

type

="query"

>

<

tokenizer

class

="org.wltea.analyzer.lucene.iktokenize***ctory"

usesmart

="false"

conf

="ik.conf"

/>

<

filter

class

="solr.stopfilte***ctory"

ignorecase

="true"

words

="lang/cnstopwords.txt"

/>

analyzer

>

fieldtype

>

cnstopwords.txt為通用詞檔案

<

fieldtype

name

="text_ik"

class

="solr.textfield"

>

<

analyzer

type

="index"

ismaxwordlength

="false"

class

="org.wltea.analyzer.lucene.ikanalyzer"

/>

<

analyzer

type

="query"

ismaxwordlength

="true"

class

="org.wltea.analyzer.lucene.ikanalyzer"

/>

fieldtype

>

同時,把需要分詞的字段,設定為text_ik,

<

field

name

="pathsummary"

type

="text_ik"

indexed

="true"

stored

="true"

multivalued

="false"

/>

<

field

name

="attr_content"

type

="text_ik"

indexed

="true"

stored

="true"

multivalued

="false"

/>

4、在admin後台, analysis 下檢視分詞效果

Solr配置IK分詞器

上傳檔案 檢視 新增配置檔案 建立classes 複製檔案 ikanalyzer.cfg.xml ext stopword.dic mydict.dic 新增分詞器,配置業務域 定義fieldtype,指定使用中文分詞器 在solrhome中定義 solrconfig.xml,用於配置solr服務 ...

solr 配置中文分詞

要在中文的專案中使用 solr 少不了要整合中文分詞元件。本篇以 ik2012 分詞為例,講解如何在 solr 3.5 中及整合中文分詞,使用 ik 的原因 ik 比其他中文分詞維護的勤快,和 solr 整合也相對容易。fieldtypename text zh class solr.textfie...

Solr學習總結(四)ik分詞配置

1.將ik的jar包copy到 solr web inf lib 下 2.在solr home mydatacore conf managed schema 檔案中增加如下配置 text ik class solr.textfield type index ismaxwordlength false...