IBM DS4300儲存災難恢復問題解析

2021-09-05 05:12:21 字數 2169 閱讀 7406

公司的乙個ibm ds4300的老儲存在十一前突然壞了,陣列掛載的資料出現丟失,比較嚴重,解決過程如下,特此記錄。

硬體環境是:ibm ds4300儲存,分了2個array,每個array都做raid5,並且各有一塊熱備盤。每個array都劃分了2個邏輯盤,其中array2的一塊380g的邏輯盤給了小型機雙機系統做共享盤,雙機上是aix+oracle10g。雙控(a控突然壞了,b控卻不能接管a控的lun,致使一部分重要資料無法尋到)。經過server raid管理軟體分析陣列日誌資訊,發現2號盤在11年8月份就出現異常,不參與raid工作,1號盤在近期才出現錯誤。經過對1、2號盤進行檢測和映象,發現2號盤有少量壞道,1號盤能正常讀取。

恢復:經過對1號盤和2號盤進行檢測和映象以後,我們嘗試把1號盤留在ds4300陣列上,把2號盤拔出來,然後在server raid管理軟體中嘗試各種辦法使1號盤狀態變成online狀態,最後終於把1號盤變成online,於是嘗試在aix下檢視相關vg資訊,發現vg資訊已經被破壞。資料恢復陷入下一步困境,經過對比1號盤和2號盤的頭部資訊,發現2號盤的頭部有相關vg資訊,於是把2號盤vg資訊copy到1號盤相應位置,再次在aix下檢視vg資訊、lv資訊,這次vg資訊完好,檔案系統mount順利,嘗試啟動oracle服務,發現oracle啟動不了,報redo1.log檔案錯誤,最後經過幾番努力,oracle終於能起來了,趕緊exp出oracle中的資料。到此資料恢復成功!

經驗總結:

ds4300上更換硬碟特別要注意,最好更換型號和韌體版本跟原來一樣的硬碟,本案例原2號盤壞過,如果需要替換原2號盤,那麼新盤的型號和韌體版本都需要跟原來的硬碟一樣,否則新換的硬碟在ds4300上執行時會不穩定,並容易出現掉線的現象。ds4300對硬碟韌體版本匹配要求比較高,更換硬碟千萬要注意韌體版本匹配問題。

還有lvm資訊是本恢復的關鍵,1號盤lvm資訊被破壞,我從2號盤看到良好的lvm資訊,copy到1號盤的相應位置,才能使整個恢復得以順利進行。

另問題:

此例中由於raid本身並沒有損壞,不需要對每個物理硬碟進行單獨映象,只需要把報錯的那個磁碟所在的lun映象出來就行。映象的方法有兩種:一種是在linux下用dd 命令把lun映象到別的儲存空間上,另一種是把要恢復的lun切換到windows上,然後通過winhex工具對硬碟進行映象。映象完成以後,資料恢復的重點就是分析xfs檔案系統結構,把資料提取數來。

可以通過達思 d-recovery for xfs資料恢復軟體,對每個映象出來的lun進行掃瞄,收集xfs檔案系統資訊(superblock,inode,目錄、檔名等),最終把資料完全提 取出來。當然,如果資料破壞不嚴重,可以把分割槽表或者superblock資訊還原到出問題之前的狀態,然後掛回linux環境,就能直接正常mount 檔案系統。資料恢復最後結果是:出問題的lun通過更改分割槽表或者superblock就能正常mount,還有乙個lun需要d-recovery for xfs工具匯出資料,最後實現非常完美的恢復。

補充:raid10架構:比如10塊146gb光纖介面硬碟,每兩塊盤做成raid1,一共5組raid1,然後這5組raid1又配置成乙個raid0,這就是所謂的混合型raid10架構. ds4300陣列掛接在ibm小型機上,劃分成aix jfs2檔案系統。這種raid架構貌似很安全,但還是會出問題。

在這種架構上,如果這5組raid1中只要壞掉一組,整個陣列就不能正常訪問,在aix上mount不上。

補充:更換損壞的控制器

ds4300雙控制器,發現a控無法online,且主機介面無光,網絡卡燈也不亮,於是在沒有控制器備件的情況下就先關主機、儲存,更換了電池,保證b控恢復正常,但是a控還是不行。

現在新控制器準備好了(但是微碼版本未知),準備再次進行更換,思路如下

儲存情況:

ds4300基本型號,雙控(a控已壞),沒有exp

firmware version: 06.12.03.00

nvsram version: n1722f600r912v05

硬碟微碼:jfq3

操作的大概步驟:

1、異地備份資料

2、收集asd

3、停資料庫,關主機、儲存

4、更換a控及電池

5、開儲存,主機暫時不開

6、同時連線兩個控制器,在沒有io讀寫的情況下,公升級硬碟微碼jfq3到jfq8

7、確認新控制器微碼版本,如果為06.12.03.00,則a、b控一樣,不用公升級;

如果高於06.12,公升級控制器微碼和a控一樣

8、開主機,再次收集asd

IBM DS4300磁碟損壞事故的資料恢復解決思路

目前,資訊中心fast600磁碟陣列磁碟損壞,造成資料盤資料無法讀取,對fast600的日誌分析如下 共有四個主機組,四台主機分別是news database 149,news pub 147,video 139為windows主機,news pic 153 為linux主機。hostgroupcl...

IBMDS儲存儲存效能調優

ibm儲存適用,其他儲存有類似引數。1 調整全域性cache引數 1 1 start and stop cache flush 這兩個引數影響控制器處理cache區域的操作,在這中情況下是按照先進先出的原則往磁碟上寫資料。這只對開啟了寫cache的情況下適用。在一般的情況下,在決大多數時候start...

IBM DS3500儲存新增控制器

ibm system storage ds3000是一款型號較老的入門級san陣列 該產品架構比較成熟穩定,效能和容量等方面可以滿足當時大多數的需要。該產品早已停產,但現在還有一些企業仍然使用該儲存。一些單位在初始配置的時候,由於資金預算有限,只為該儲存配置了乙個控制器。現在市場上乙個二手的控制器價...