Redis記憶體使用優化與儲存

redis最為常用的資料型別主要有以下五種：

在具體描述這幾種資料型別之前，我們先通過一張圖了解下redis內部記憶體管理中是如何描述這些不同資料型別的：

首先redis內部使用乙個redisobject物件來表示所有的key和value,redisobject最主要的資訊如上圖所示：type代表乙個value物件具體是何種資料型別，encoding是不同資料型別在redis內部的儲存方式，比如：type=string代表value儲存的是乙個普通字串，那麼對應的encoding可以是raw或者是int,如果是int則代表實際redis內部是按數值型類儲存和表示這個字串的，當然前提是這個字串本身可以用數值表示，比如:"123" "456"這樣的字串。

這裡需要特殊說明一下vm欄位，只有開啟了redis的虛擬記憶體功能，此字段才會真正的分配記憶體，該功能預設是關閉狀態的，該功能會在後面具體描述。通過上圖我們可以發現redis使用redisobject來表示所有的key/value資料是比較浪費記憶體的，當然這些記憶體管理成本的付出主要也是為了給redis不同資料型別提供乙個統一的管理介面，實際作者也提供了多種方法幫助我們盡量節省記憶體使用，我們隨後會具體討論。

下面我們先來逐一的分析下這五種資料型別的使用和內部實現方式：

通過我們上面的一些實現上的分析可以看出redis實際上的記憶體管理成本非常高，即占用了過多的記憶體，作者對這點也非常清楚，所以提供了一系列的引數和手段來控制和節省記憶體，我們分別來討論下。

首先最重要的一點是不要開啟redis的vm選項，即虛擬記憶體功能，這個本來是作為redis儲存超出物理記憶體資料的一種資料在記憶體與磁碟換入換出的乙個持久化策略，但是其記憶體管理成本也非常的高，並且我們後續會分析此種持久化策略並不成熟，所以要關閉vm功能，請檢查你的redis.conf檔案中 vm-enabled 為 no。

其次最好設定下redis.conf中的maxmemory選項，該選項是告訴redis當使用了多少物理記憶體後就開始拒絕後續的寫入請求，該引數能很好的保護好你的redis不會因為使用了過多的物理記憶體而導致swap,最終嚴重影響效能甚至崩潰。

另外redis為不同資料型別分別提供了一組引數來控制記憶體使用，我們在前面詳細分析過redis hash是value內部為乙個hashmap，如果該map的成員數比較少，則會採用類似一維線性的緊湊格式來儲存該map, 即省去了大量指標的記憶體開銷，這個引數控制對應在redis.conf配置檔案中下面2項：

hash-max-zipmap-entries 64

hash-max-zipmap-value 512

hash-max-zipmap-entries

含義是當value這個map內部不超過多少個成員時會採用線性緊湊格式儲存，預設是64,即value內部有64個以下的成員就是使用線性緊湊儲存，超過該值自動轉成真正的hashmap。

hash-max-zipmap-value 含義是當 value這個map內部的每個成員值長度不超過多少位元組就會採用線性緊湊儲存來節省空間。

以上2個條件任意乙個條件超過設定值都會轉換成真正的hashmap，也就不會再節省記憶體了，那麼這個值是不是設定的越大越好呢，答案當然是否定的，hashmap的優勢就是查詢和操作的時間複雜度都是o(1)的，而放棄hash採用一維儲存則是o(n)的時間複雜度，如果

成員數量很少，則影響不大，否則會嚴重影響效能，所以要權衡好這個值的設定，總體上還是最根本的時間成本和空間成本上的權衡。

同樣類似的引數還有：

list-max-ziplist-entries 512

說明：list資料型別多少節點以下會採用去指標的緊湊儲存格式。

list-max-ziplist-value 64

說明：list資料型別節點值大小小於多少位元組會採用緊湊儲存格式。

set-max-intset-entries 512

說明：set資料型別內部資料如果全部是數值型，且包含多少節點以下會採用緊湊格式儲存。

最後想說的是redis內部實現沒有對記憶體分配方面做過多的優化，在一定程度上會存在記憶體碎片，不過大多數情況下這個不會成為redis的效能瓶頸，不過如果在redis內部儲存的大部分資料是數值型的話，redis內部採用了乙個shared integer的方式來省去分配記憶體的開銷，即在系統啟動時先分配乙個從1~n 那麼多個數值物件放在乙個池子中，如果儲存的資料恰好是這個數值範圍內的資料，則直接從池子裡取出該物件，並且通過引用計數的方式來共享，這樣在系統儲存了大量數值下，也能一定程度上節省記憶體並且提高效能，這個引數值n的設定需要修改源**中的一行巨集定義redis_shared_integers，該值預設是10000，可以根據自己的需要進行修改，修改後重新編譯就可以了。

redis由於支援非常豐富的記憶體資料結構型別，如何把這些複雜的記憶體組織方式持久化到磁碟上是乙個難題，所以redis的持久化方式與傳統資料庫的方式有比較多的差別，redis一共支援四種持久化方式，分別是：

在設計思路上，前兩種是基於全部資料都在記憶體中，即小資料量下提供磁碟落地功能，而後兩種方式則是作者在嘗試儲存資料超過物理記憶體時，即大資料量的資料儲存，截止到本文，後兩種持久化方式仍然是在實驗階段，並且vm方式基本已經被作者放棄，所以實際能在生產環境用的只有前兩種，換句話說redis目前還只能作為小資料量儲存（全部資料能夠載入在記憶體中），海量資料儲存方面並不是redis所擅長的領域。下面分別介紹下這幾種持久化方式：

定時快照方式(snapshot)：

該持久化方式實際是在redis內部乙個定時器事件，每隔固定時間去檢查當前資料發生的改變次數與時間是否滿足配置的持久化觸發的條件，如果滿足則通過作業系統fork呼叫來建立出乙個子程序，這個子程序缺省會與父程序共享相同的位址空間，這時就可以通過子程序來遍歷整個記憶體來進行儲存操作，而主程序則仍然可以提供服務，當有寫入時由作業系統按照記憶體頁(page)為單位來進行copy-on-write保證父子程序之間不會互相影響。

該持久化的主要缺點是定時快照只是代表一段時間內的記憶體映像，所以系統重啟會丟失上次快照與重啟之間所有的資料。

基於語句追加方式(aof)：

aof方式實際類似mysql的基於語句的binlog方式，即每條會使redis記憶體資料發生改變的命令都會追加到乙個log檔案中，也就是說這個log檔案就是redis的持久化資料。

aof的方式的主要缺點是追加log檔案可能導致體積過大，當系統重啟恢復資料時如果是aof的方式則載入資料會非常慢，幾十g的資料可能需要幾小時才能載入完，當然這個耗時並不是因為磁碟檔案讀取速度慢，而是由於讀取的所有命令都要在記憶體中執行一遍。另外由於每條命令都要寫log,所以使用aof的方式，redis的讀寫效能也會有所下降。

虛擬記憶體方式：

虛擬記憶體方式是redis來進行使用者空間的資料換入換出的乙個策略，此種方式在實現的效果上比較差，主要問題是**複雜，重啟慢，複製慢等等，目前已經被作者放棄。

diskstore方式：

diskstore方式是作者放棄了虛擬記憶體方式後選擇的一種新的實現方式，也就是傳統的b-tree的方式，目前仍在實驗階段，後續是否可用我們可以拭目以待。

有redis線上運維經驗的人會發現redis在物理記憶體使用比較多，但還沒有超過實際物理記憶體總容量時就會發生不穩定甚至崩潰的問題，有人認為是基於快照方式持久化的fork系統呼叫造成記憶體占用加倍而導致的，這種觀點是不準確的，因為fork 呼叫的copy-on-write機制是基於作業系統頁這個單位的，也就是只有有寫入的髒頁會被複製，但是一般你的系統不會在短時間內所有的頁都發生了寫入而導致複製，那麼是什麼原因導致redis崩潰的呢？

答案是redis的持久化使用了buffer io造成的，所謂buffer io是指redis對持久化檔案的寫入和讀取操作都會使用物理記憶體的page cache,而大多數資料庫系統會使用direct io來繞過這層page cache並自行維護乙個資料的cache，而當redis的持久化檔案過大(尤其是快照檔案)，並對其進行讀寫時，磁碟檔案中的資料都會被載入到物理記憶體中作為作業系統對該檔案的一層cache,而這層cache的資料與redis記憶體中管理的資料實際是重複儲存的，雖然核心在物理記憶體緊張時會做page cache的剔除工作，但核心很可能認為某塊page cache更重要，而讓你的程序開始swap ,這時你的系統就會開始出現不穩定或者崩潰了。我們的經驗是當你的redis物理記憶體使用超過記憶體總容量的3/5時就會開始比較危險了。

下圖是redis在讀取或者寫入快照檔案dump.rdb後的記憶體資料圖：

根據業務需要選擇合適的資料型別，並為不同的應用場景設定相應的緊湊儲存引數。

當業務場景不需要資料持久化時，關閉所有的持久化方式可以獲得最佳的效能以及最大的記憶體使用量。

如果需要使用持久化，根據是否可以容忍重啟丟失部分資料在快照方式與語句追加方式之間選擇其一，不要使用虛擬記憶體以及diskstore方式。

不要讓你的redis所在機器物理記憶體使用超過實際記憶體總量的3/5。

Redis記憶體使用優化與儲存

Redis記憶體使用優化與儲存

Redis記憶體使用優化與儲存

Redis記憶體使用優化與儲存

相關推薦