solr配置中文解析 分詞 器

2021-07-11 07:44:03 字數 1180 閱讀 6531

前提:

1、在solr中預設是沒有中文分析器的,需要手工配置。需要配置乙個fieldtype,在fieldtype中指定中文分析器。

2、solr中的字段必須是先定義後使用。

一、使用ik-analyzer

。把分析器的資料夾上傳到伺服器

[root@winy ik analyzer 2012ff_hf1]# pwd

/soft/ik analyzer 2012ff_hf1

二、需要把分析器的jar

包新增到

solr

工程中。

[root@winy ik analyzer 2012ff_hf1]# pwd

/soft/ik analyzer 2012ff_hf1

三、需要把

ikanalyzer

需要的擴充套件詞典及停用詞詞典、配置檔案複製到

solr

工程的classpath

首先建立乙個目錄:

然後把檔案複製到solr工程classpath

[root@winy ik analyzer 2012ff_hf1]#

注意:擴充套件詞典及停用詞詞典的字符集必須是utf-8

。不能使用

windows

記事本編輯

四、配置fieldtype。需要在solrhome/collection1/conf/schema.xml中配置

技巧:使用vi、vim跳轉到文件開頭gg。跳轉到文件末尾:g

[root@winy conf]# pwd

/usr/local/solr/solrhome/collection1/conf

[root@winy conf]# vi schema.xml

在文件最下面新增:

上面

五、再加上業務字段查詢域

根據業務判斷:查詢是否顯示來判斷是否儲存 stored="true"

六、重啟tomcat測試

在solr管理頁面analysis的fieldtype下拉框中即會顯示上面的item_title、item_desc

solr配置中文分詞器

可能需要連線上篇 solr與tomcat整合 將data裡的.dic檔案拷貝到dic目錄 3.修改schema.xml檔案,增加下面 注意你需要修改的是dicpath引數 fieldtype name textcomplex class solr.textfield analyzer tokeniz...

solr配置中文分詞器

一 smartcn 自 1 將自帶的jar包拷貝到tomcat下 檔案 solr 5.1.0 contrib analysis extras lucene libs lucene analyzers smartcn 5.1.0.jar 2 修改schema.xml,新增 3 測試 二 mmseg4j...

solr配置中文分詞器

在 opt solr 7.7.1 server solr article core conf資料夾下的 managed schema檔案中配置ik中文分詞器 測試分詞效果 配置停用詞 擴充套件詞 同義詞 停止詞 的功能是過濾,把 啊 加入到停止詞的字典裡,比如搜尋 你好啊 solr會過濾掉 啊 以 ...