solr 引入中文分詞器

2021-09-29 15:22:28 字數 973 閱讀 8527

ik analyzer 擴充套件配置

ext.dic

my_ext_stopword.dic

ext.dic:存放同義詞:

厲害了我的國

相同,相似,相近

電腦,膝上型電腦=>計算機

my_ext_stopword.dic:存放停用詞:

的地了

你我他它

不嗯

需要引入的jar:

配置solrconfig.xml:

db-data-config.xml

db-data-config.xmf增量匯入配置檔案:

'$'" 

deltaimportquery ="select * from db_video_copy where id = $"

>

'$'"

parentdeltaquery ="select id from db_video_copy where id = $"

>

managed-schema配置檔案新增欄位與中文分詞器 :

結果:

solr配置中文分詞器

可能需要連線上篇 solr與tomcat整合 將data裡的.dic檔案拷貝到dic目錄 3.修改schema.xml檔案,增加下面 注意你需要修改的是dicpath引數 fieldtype name textcomplex class solr.textfield analyzer tokeniz...

solr配置中文分詞器

一 smartcn 自 1 將自帶的jar包拷貝到tomcat下 檔案 solr 5.1.0 contrib analysis extras lucene libs lucene analyzers smartcn 5.1.0.jar 2 修改schema.xml,新增 3 測試 二 mmseg4j...

solr配置中文分詞器

在 opt solr 7.7.1 server solr article core conf資料夾下的 managed schema檔案中配置ik中文分詞器 測試分詞效果 配置停用詞 擴充套件詞 同義詞 停止詞 的功能是過濾,把 啊 加入到停止詞的字典裡,比如搜尋 你好啊 solr會過濾掉 啊 以 ...