前提:
1、在solr中預設是沒有中文分析器的,需要手工配置。需要配置乙個fieldtype,在fieldtype中指定中文分析器。
2、solr中的字段必須是先定義後使用。
一、使用ik-analyzer
。把分析器的資料夾上傳到伺服器
[root@winy ik analyzer 2012ff_hf1]# pwd
/soft/ik analyzer 2012ff_hf1
二、需要把分析器的jar
包新增到
solr
工程中。
[root@winy ik analyzer 2012ff_hf1]# pwd
/soft/ik analyzer 2012ff_hf1
三、需要把
ikanalyzer
需要的擴充套件詞典及停用詞詞典、配置檔案複製到
solr
工程的classpath
首先建立乙個目錄:
然後把檔案複製到solr工程classpath
[root@winy ik analyzer 2012ff_hf1]#
注意:擴充套件詞典及停用詞詞典的字符集必須是utf-8
。不能使用
windows
記事本編輯
四、配置fieldtype。需要在solrhome/collection1/conf/schema.xml中配置
技巧:使用vi、vim跳轉到文件開頭gg。跳轉到文件末尾:g
[root@winy conf]# pwd
/usr/local/solr/solrhome/collection1/conf
[root@winy conf]# vi schema.xml
在文件最下面新增:
上面
五、再加上業務字段查詢域
根據業務判斷:查詢是否顯示來判斷是否儲存 stored="true"
六、重啟tomcat測試
在solr管理頁面analysis的fieldtype下拉框中即會顯示上面的item_title、item_desc
solr配置中文分詞器
可能需要連線上篇 solr與tomcat整合 將data裡的.dic檔案拷貝到dic目錄 3.修改schema.xml檔案,增加下面 注意你需要修改的是dicpath引數 fieldtype name textcomplex class solr.textfield analyzer tokeniz...
solr配置中文分詞器
一 smartcn 自 1 將自帶的jar包拷貝到tomcat下 檔案 solr 5.1.0 contrib analysis extras lucene libs lucene analyzers smartcn 5.1.0.jar 2 修改schema.xml,新增 3 測試 二 mmseg4j...
solr配置中文分詞器
在 opt solr 7.7.1 server solr article core conf資料夾下的 managed schema檔案中配置ik中文分詞器 測試分詞效果 配置停用詞 擴充套件詞 同義詞 停止詞 的功能是過濾,把 啊 加入到停止詞的字典裡,比如搜尋 你好啊 solr會過濾掉 啊 以 ...