(1)定義型別
或者使用下面的方式:
(2)使用型別
3、如果要自定義詞庫時,需要執行這步驟。
(1)準備ikanalyzer.cfg.xml配置檔案
<?xml version="1.0" encoding="utf-8"?>
ik analyzer 擴充套件配置
ext.dic;
stopword.dic;
jdbc:mysql:
root
123456
t_tict
seq_no
60(2)準備ext.dic和stopword.dic檔案,這2個檔案就是普通的文字檔案,每行乙個詞,注意最好用notepad++以utf-8無bom格式編碼。
比如在ext.dic中輸入:魔獸世界,那麼在分詞的時候就會分為魔獸世界、魔獸、世界三個詞,如果沒有自定義詞庫,那麼ik會將其分為魔獸、世界兩個詞。
stopword.dic:停頓詞,一般用沒有實際意義的詞,比如:啊、等、等等、雖然、但是
4、重啟各節點的solr服務 Solr配置IK分詞器
上傳檔案 檢視 新增配置檔案 建立classes 複製檔案 ikanalyzer.cfg.xml ext stopword.dic mydict.dic 新增分詞器,配置業務域 定義fieldtype,指定使用中文分詞器 在solrhome中定義 solrconfig.xml,用於配置solr服務 ...
Elasticsearch ik分詞器的配置和使用
2.解壓包解壓出來乙個名為elasticsearch的資料夾如下圖 3.將 elasticsearch 資料夾重新命名為ik 4.將ik資料夾放入 elasticsearch目錄的plugins資料夾下即可 如下圖所示 5.在瀏覽器輸入 text 我是程式設計師 ik分詞器貼合中文 列如 我是程式設...
solr配置IK分詞器並設定粗細粒度
solr加入索引時使用分詞器,搜尋時也使用該分詞器,導致搜尋時返回資料不準確 如 搜尋清華大學 經ik分詞顯示結果為 清華 大學 清華大學 此時結果中含有大學的都會被返回 北京大學 清華大學 這不是我們想要返回結果 我們希望只有清華大學被顯示出來 也就是說在搜尋的詞中不分詞 在配置ik分詞器時加入屬...