ElasticSearch權威指南學習(索引管理)

2021-09-25 10:13:05 字數 2111 閱讀 8525

當我們需要確保索引被建立在適當數量的分片上,在索引資料之前設定好分析器和型別對映。

手動建立索引,在請求中加入所有設定和型別對映,如下所示:

put /my_index

, ...

}

你可以通過在 config/elasticsearch.yml 中新增下面的配置來防止自動建立索引。

action.auto_create_index: false
使用以下的請求來刪除索引:

delete /my_index
用下面的方式刪除多個索引

delete /index_one,index_two

delete /index_*

甚至可以刪除所有索引

delete /_all
下面是兩個最重要的設定:

number_of_replicas

例如,我們可以建立只有乙個主分片,沒有複製分片的小索引。

put /my_temp_index

}

然後,我們可以用 update-index-settings api 動態修改複製分片個數

put /my_temp_index/_settings

第三個重要的索引設定是 analysis 部分,用來配置已存在的分析器或建立自定義分析器來定製化你的索引。

在下面的例子中,我們建立了乙個新的分析器,叫做 es_std,並使用預定義的西班牙語停用詞:

put /spanish_docs}}

}}

雖然 elasticsearch 內建了一系列的分析器,但是真正的強大之處在於定製你自己的分析器。你可以通過在配置檔案中組合字元過濾器,分詞器和標記過濾器,來滿足特定資料的需求。

與索引設定一樣,我們預先配置好 es_std 分析器,我們可以再 analysis 欄位下配置字元過濾器,分詞器和標記過濾器:

put /my_index

, "tokenizer": ,

"filter": ,

"analyzer": }}

}

作為例子,我們來配置乙個這樣的分析器:
"char_filter": 

}

"filter": 

}

"analyzer": 

}

put /my_index

}, "filter": },

"analyzer": }

}}}

get /my_index/_analyze

get /my_index/_analyze?analyzer=my_analyzer

the quick & brown fox

,,,

]}

## 元資料:_source 字段

在搜尋請求中你可以通過限定 _source 欄位來請求指定字段:

get /_search

}, "_source": [ "title", "created" ]

}

元資料:_all 字段

如果你決定不再使用 _all 字段,你可以通過下面的對映禁用它:

}}我們可以使用 default 對映對所有型別禁用 _all 字段,而只在 blog 欄位上開啟它:

put /my_index

},"blog": }}

}

default 對映也是定義索引級別的動態模板的好地方。

一口氣學到這裡,這章開始已經有點力不從心了,很多東西已經理解不了了,需要實際工作中,不斷查詢資料深入學習理解才能掌控了,索引管理的內容這裡並不全面,我理解不了的地方這裡我也不寫了~

《Elasticsearch 權威指南》閱讀筆記

原文 elasticsearch 權威指南 技術上來說,乙個主分片最大能夠儲存 integer.max value 128 個文件,但是實際最大值還需要參考你的使用場景 包括你使用的硬體,文件的大小和複雜程度,索引和查詢文件的方式以及你期望的響應時長。索引在預設情況下會被分配5個主分片 如果你的資料...

Hadoop 權威指南

rpm包和deb包是兩種linux系統下最常見的安裝包格式,在安裝一些軟體或服務的時候免不了要和它們打交道。rpm包主要應用在redhat系列包括 fedora等發行版的linux系統上,deb包主要應用於debian系列包括現在比較流行的ubuntu等發行版上。yum可以用於運作rpm包,例如在f...

HTTP權威指南

web 伺服器會為所有 http 物件資料附加乙個 mime 型別,content type image jpeg,content length 12984 伺服器資源名被稱為統一資源識別符號 uniform resource identifier,uri uri 就像網際網路上的郵政位址一樣,在世...