在資料儲存領域,對於管理員以及使用者來說,最怕的無非就乙個事情:資料損壞了(這裡我們暫不考慮資料被惡意篡改寫入的情況)。可能很多人也會假設正常情況下,資料自己損壞的概率應該可以低到忽略不計吧…今天筆者來簡單聊聊這個被很少提及的話題,以及相關針對資料損壞,我們現有的一些修復手段和策略。
當磁碟中儲存的資料有一天突然壞了,我們大部分時刻第一時間聯想到的一般是乙個解釋起來十分模糊的原因:機器硬體老化故障,壞了。但其實這裡面我們可以再進一步**其原因本質。
對應上述3種情況,下面對應的策略手段。
如果是第一種硬體故障的情況,直接的修復方法就是硬體維修,沒有特別的解決辦法了,上面的資料只能靠備份冗餘的資料進行恢復了。
對於位衰減手段,其實當前的資料恢復技術(比如磁碟raid)其實很難檢測出來,不過這型別問題可以依靠ecc做檢測和修復(大部分情況並不是總是)。
對於第三類寫區域性丟失情況,這裡面其實是乙個區域性資料錯誤的問題了。在系統層面角度而言,資料是沒有問題的,所以這類問題在軟體容錯層面也難以被檢測出來。這個只有當使用者真正去讀的時候,才會發現實際資料是不正確的。一般這種情況,可以依賴額外離線工具的定期checksum的檢驗。如若發現資料錯誤現象,然後對其進行修復。
在錯誤資料的修復過程裡,一定要確保修復行為的正確性。因為修復行為本身也是對實際資料的一種更新操作,此時一定要確保資料是往正確的方式在修復,如若修復失敗,反而會造成更大程度的資料損壞。
總而言之,讓系統提前預知資料錯誤的代價總比直到使用者讀取到錯誤資料時的代價成本低。
IBM DS4300磁碟損壞事故的資料恢復解決思路
目前,資訊中心fast600磁碟陣列磁碟損壞,造成資料盤資料無法讀取,對fast600的日誌分析如下 共有四個主機組,四台主機分別是news database 149,news pub 147,video 139為windows主機,news pic 153 為linux主機。hostgroupcl...
Cassandra解決單個磁碟損壞的情況
cassandra乙個節點的磁碟壞了,分兩種情況,一種是節點還可以正常啟動。另外一種是節點無法啟動。第一種情況 節點還可以正常啟動 1 把壞的盤換掉,如果你沒有新的盤去更換,你可以在cassandra.yaml裡直接把壞的盤注釋掉 2 啟動cassandra,如果啟動的過程中報錯,說找不到keysp...
磁碟檔案系統損壞要怎麼找回資料
檔案系統損壞說明這個盤的檔案系統結構損壞了。在平時如果資料不重要,那麼可以直接格式化就能用了。但是有的時候裡面的資料很重要,那麼就必須先恢復出資料再格式化。具體恢復方法可以看正文了解 不格式化的恢復方法 工具 軟體 auroradatarecovery 步驟2 軟體開啟後,直接雙擊需要恢復的分割槽 ...