文章**
near realtime(nrt):近實時,兩個意思,從寫入資料到資料可以被搜尋到有乙個小延遲(大概1秒);基於es執行搜尋和分析可以達到秒級
集群,包含多個節點,每個節點屬於哪個集群是通過乙個配置(集群名稱,預設是elasticsearch)來決定的,對於中小型應用來說,剛開始乙個集群就乙個節點很正常
節點,集群中的乙個節點,節點也有乙個名稱(預設是隨機分配的),節點名稱很重要(在執行運維管理操作的時候),預設節點會去加入乙個名稱為「elasticsearch」的集群,如果直接啟動一堆節點,那麼它們會自動組成乙個elasticsearch集群,當然乙個節點也可以組成乙個elasticsearch集群
文件,es中的最小資料單元,乙個document可以是一條客戶資料,一條商品分類資料,一條訂單資料,通常用json資料結構表示,每個index下的type中,都可以去儲存多個document。乙個document裡面有多個field,每個field就是乙個資料字段。
索引,包含一堆有相似結構的文件資料,比如可以有乙個客戶索引,商品分類索引,訂單索引,索引有乙個名稱。乙個index包含很多document,乙個index就代表了一類類似的或者相同的document。比如說建立乙個product index,商品索引,裡面可能就存放了所有的商品資料,所有的商品document。
單台機器無法儲存大量資料,es可以將乙個索引中的資料切分為多個shard,分布在多台伺服器上儲存。有了shard就可以橫向擴充套件,儲存更多資料,讓搜尋和分析等操作分布到多台伺服器上去執行,提公升吞吐量和效能。每個shard都是乙個lucene index。
任何乙個伺服器隨時可能故障或宕機,此時shard可能就會丟失,因此可以為每個shard建立多個replica副本。replica可以在shard故障時提供備用服務,保證資料不丟失,多個replica還可以提公升搜尋操作的吞吐量和效能。primary shard(建立索引時一次設定,不能修改,預設5個),replica shard(隨時修改數量,預設1個),預設每個索引10個shard,5個primary shard,5個replica shard,最小的高可用配置,是2臺伺服器。
Elasticsearch核心概念
elasticsearch使用lucene作為其底層的搜尋引擎,關於lucene的介紹,可以參考官方 lucene關鍵概念 lucene使用inverted index來儲存term在document中位置的對映關係。譬如如下文件 使用inverted index儲存,乙個簡單地對映關係 term ...
Elasticsearch核心概念
一 cluster 1 代表乙個集群,有乙個主節點,通過選舉產生。對外部來說es去中心化,邏輯上是乙個整體。2 主節點負責管理集群狀態,包括管理分片狀態和副本狀態,以及節點的發現和刪除 3 主節點不負責對資料的增刪改查請求處理,只負責維護集群相關狀態 二 shards 分片 1 索引分片,es可以把...
Elasticsearch核心指標
基於google的監控方案,將es監控歸為兩大類五個子類,分別是黑盒監控和白盒監控 四個 指標 詳情可以參考書籍 sre google運維解密 第53頁 黑盒監控 白盒監控 延時 容量 流量 風險提示 上述指標大部分都是基於es介面進行的採集,因此在es故障期間,上述指標可能無法採集,因此,還需要通...