Elasticsearch(四)IK分詞外掛程式

2021-09-10 22:51:57 字數 2464 閱讀 9050

1.ik分詞外掛程式的安裝

瀏覽器訪問: 

選擇 releases 版本,是已經打包好的,解壓就可以使用。

進入elsaticsearch的plugins目錄下,將ik分詞外掛程式解壓後拷貝進去,重啟elasticsearch

需要選擇 elasticsearch-analysis-ik-5.4.1.zip 第乙個

然後切換為root使用者對elastic 使用者重新授權

chown -r elastic /home/elasticsearch/elasticsearch-5.4.1 

2.重啟elasticsearch

ps -ef | grep elastic
kill -9 es程序。

重啟es:  ./bin/elasticsearch &

顯示載入了ik分詞器。

3.測試ik分詞器

建立text索引 :

put test

獲取test索引的細粒度分詞 ik_max_word :

get test/_analyze?analyzer=ik_max_word

分詞結果:

獲取test索引的粗粒度分詞 ik_smart:

get test/_analyze?analyzer=ik_smart

分詞結果:

4.使用ik分詞器官網的測試案例

執行命令:

//建立index 索引

put /index

}}//插入四條資料

post /index/fulltext/1

post /index/fulltext/2

post /index/fulltext/3

post /index/fulltext/4

//查詢包含中國的文件

post /index/fulltext/_search

}, "highlight" : }}

}

查詢結果:共有兩條資料

,

"hits": ,

"highlight": },,

"highlight": }]

}}

5,擴充套件詞庫

新增newword.dic 到/home/elasticsearch/elasticsearch-5.4.1/plugins/elasticsearch-analysis-ik-5.4.1/config目錄下

在ikanalyzer.cfg.xml中指定自定義詞典的位置

重啟elasticsearch

擴充套件前,輸入命令

get test/_analyze?analyzer=ik_smart

get test/_analyze?analyzer=ik_smart

輸出結果

結果1:

, ,,,

]}結果2:

, ,

]}

擴充套件中:在custom目錄下vi newdic.dic

加入兩行,儲存退出

將新加入的詞典檔案加入 ikanalyzer.cfg.xml中

custom/newdic.dic;custom/mydict.dic;custom/single_word_low_freq.dic

重啟elastic和kibana

擴充套件後分詞結果:

結果1:

]}結果2:

]}

ElasticSearch 攻略(四)簡易搜尋

之前獲取 es 是單條 記錄 例如 getresponse response client.prepareget twitter tweet 1 get 如果獲取記錄列表則要通過 搜尋 最簡單的 es 搜尋是 import org.elasticsearch.action.search.search...

elasticsearch 集群初識篇(四)

elasticsearch 的集群監控資訊中包含了許多的統計資料,其中最為重要的一項就是 集群健康 它在 status 欄位中展示為 green yellow 或者 red get cluster healthstatus 字段指示著當前集群在總體上是否工作正常。它的三種顏色含義如下 我們往 ela...

Elasticsearch實踐(四) IK分詞

環境 elasticsearch 6.2.4 kibana 6.2.4 ik 6.2.4 elasticsearch預設也能對中文進行分詞。我們先來看看自帶的中文分詞效果 get analyze 結果 我們發現,是按照每個字進行分詞的。這種在實際應用裡肯定達不到想要的效果。當然,如果是日誌搜尋,使用...