使用es心中還是得有一筆賬,雖然自己沒有做大規模資料的先例,但是公司決定開始做這件事情,資料是慢慢積累起來的,教科書上或阿里等大公司的參照其實也失去了意義,總不能什麼讓網際網路告訴你所有的過程吧。所以我記錄一些心得,和測算的歷程,有錯就糾正,經過一段時間的歷練,應該有所悟吧。
1 單es索引備份
空間是按照資料量來的,下面可以是兩個副本的大小,但是這麼看根本看不出來是兩個。
再看看裡面的,可以看到index-0
和index-1
,這裡體現出了兩個備份。
檢視index-0
和index-1
內容分別為,根據其內容,就可以跟上面的對應上了。
],"indices":}}
,],"indices":}}
2 es自身的檔案elasticsearch.yml
指定了資料和日誌的路徑
相信大多數公司接觸大資料的時候,都比較保守,不會那麼激進,不會一開動不動就搞個1t。我在搭建elasticsearch集群,採用的是3臺4核8g100g磁碟的虛擬機器,執行了大半年,資料到了需要擴容的程度
執行get _cat/shards/my_index?v
可以檢視到,乙個索引資料實際分布到各個節點機器的不同分片上了。
3.1 垂直擴容
簡單的說就是增加容量.雖然es總結-對elasticsearch進行擴容,如何超出擴容極限?有些文章推薦的是水平擴容。難道垂直擴容就不行嗎,這裡整理一下垂直擴容的資料。
3.2 水平擴容
簡單的說就是增加機器,推薦的是水平擴容
第13章 演算法
一 字串反轉 void char reverse char cha 呼叫 如下 char ch hello,world char reverse ch 二 鍊錶反轉 返回反轉後的煉表頭結點 return newh 三 有序陣列合併 將有序陣列a和b的值合併到乙個陣列result當中,且仍然保持有序 ...
第13章 物件導向程式設計 13
13.13.3 迭代器 randseq和anyiter 1.randseq from random import choice class randseq object def init self,seq self.data seq def iter self return self def nex...
程式設計珠璣第13章
正文 為了解決在12章中的隨機數問題,本章中的目的是對檢視是否在陣列中的情況進行處理。那麼這裡採用了以下幾種方法 1 採用c 的set 2 採用陣列 3 採用鍊錶,順序搜尋,插入時不用移動。結果是陣列的比鍊錶的要快 1 鍊錶需要讀入的記憶體數比陣列大 2 陣列訪問有較好的記憶體相聯性,而鍊錶則不能保...