elasticsearch核心概念

文章**

near realtime（nrt）：近實時，兩個意思，從寫入資料到資料可以被搜尋到有乙個小延遲（大概1秒）；基於es執行搜尋和分析可以達到秒級

集群，包含多個節點，每個節點屬於哪個集群是通過乙個配置（集群名稱，預設是elasticsearch）來決定的，對於中小型應用來說，剛開始乙個集群就乙個節點很正常

節點，集群中的乙個節點，節點也有乙個名稱（預設是隨機分配的），節點名稱很重要（在執行運維管理操作的時候），預設節點會去加入乙個名稱為「elasticsearch」的集群，如果直接啟動一堆節點，那麼它們會自動組成乙個elasticsearch集群，當然乙個節點也可以組成乙個elasticsearch集群

文件，es中的最小資料單元，乙個document可以是一條客戶資料，一條商品分類資料，一條訂單資料，通常用json資料結構表示，每個index下的type中，都可以去儲存多個document。乙個document裡面有多個field，每個field就是乙個資料字段。

索引，包含一堆有相似結構的文件資料，比如可以有乙個客戶索引，商品分類索引，訂單索引，索引有乙個名稱。乙個index包含很多document，乙個index就代表了一類類似的或者相同的document。比如說建立乙個product index，商品索引，裡面可能就存放了所有的商品資料，所有的商品document。

單台機器無法儲存大量資料，es可以將乙個索引中的資料切分為多個shard，分布在多台伺服器上儲存。有了shard就可以橫向擴充套件，儲存更多資料，讓搜尋和分析等操作分布到多台伺服器上去執行，提公升吞吐量和效能。每個shard都是乙個lucene index。

任何乙個伺服器隨時可能故障或宕機，此時shard可能就會丟失，因此可以為每個shard建立多個replica副本。replica可以在shard故障時提供備用服務，保證資料不丟失，多個replica還可以提公升搜尋操作的吞吐量和效能。primary shard（建立索引時一次設定，不能修改，預設5個），replica shard（隨時修改數量，預設1個），預設每個索引10個shard，5個primary shard，5個replica shard，最小的高可用配置，是2臺伺服器。

elasticsearch核心概念

Elasticsearch核心概念

Elasticsearch核心概念

Elasticsearch核心指標

elasticsearch核心概念

Elasticsearch核心概念

Elasticsearch核心概念

Elasticsearch核心指標

相關推薦