中石化某省分公司的資訊管理平台,幾台vmware虛擬機器——esx server共享一台ibm ds4100儲存,大約有40~50組虛擬機器,占用1.8tb空間,正常工作中,vc裡報告虛擬磁碟丟失,ssh到esx中執行fdisk -l檢視磁碟,發現storage已經沒有分割槽表了。重啟所有裝置後,esx server均無法連線到ds4100所在的storage。
我們接到案例後仔細詢問當時的管理員但是可用資訊不多,但是他們無意間提到曾經在這個儲存網路裡連線過一台windows 2003伺服器,具體情況不詳。於是很自然地想到了,可能是那台windows 2003因對storage的獨享操作導致了整個vmfs卷損壞。
以整個儲存做分析發現分割槽表清0,有55aa有效結束標誌,有硬碟id標誌。簡單從前向後檢視,發現乙個ntfs卷,但似乎並未寫資料進去,像乙個剛剛格式化的卷,對這個ntfs卷的bitmap做分析,得知大小約為1.8t(全部空間),前部占用部分空間,3g左右位置占用部分空間,0.9t附近占用部分空間,但總占用空間不超過100m。針對vmfs卷進行分析,發現在原1.8tb的磁碟裡有2組vmfs分割槽,第2組是對第一組的extend,第一組約1.5t,第二組約300gb,因ntfs分割槽並未寫資料到第二個vmfs分割槽裡(最後乙個扇區的dbr備份沒有覆蓋有用資料),所以重點在於第乙個vmfs分割槽。分析第一組vmfs,捲頭結構丟失,一級索引、二級索引均存在,ntfs覆蓋的資料區正好是某組虛擬機器的臨時記憶體映象,損壞也無妨。
通過以上分析,我們就可以進行資料的恢復了,
第一步:對整個storage進行映象備份。
第二步:分析後,連線兩個vmfs分割槽,直接按照vmfs分析組織方式提取所有vmdk及配置檔案。
第三步:通過nfs直接遷移回esx server。
另:本例中因已對故障儲存做了安全備份,修復中同時直接重建第一組vmfs捲頭,索引列表、分割槽表等資訊,直接附加在esx server環境,算是第二個方案。
經過兩天的努力,資料成功恢復,在此感謝工程師們為此付出的努力。
[其他]
1、本例中依然是因為光纖環境互斥不當導致的問題,實際上,應該是這個卷在windows系統做了重新分割槽,並格式化成了ntfs,之後又對分割槽做了刪除操作。因esx vmfs的互斥不依賴於硬體,只依賴於作業系統驅動層,所以在其他伺服器接入儲存網路時一定要小心,盡量考慮好儲存分配許可權。
2、esx因便捷的資訊集中管理,真正使用中往往資料特別重要,一定要做好備份工作,並考慮損壞時遷移的方便性。
kvm虛擬機器刪除後資料恢復過程
kvm虛擬機器.kernel based virtual machine的簡稱,是乙個開源的系統虛擬化模組,自linux 2.6.20之後整合在linux的各個主要發行版本中。它使用linux自身的排程器進行管理。客戶的物理機器作業系統為linux系統,檔案系統為ext4檔案系統。其上的kvm虛擬機...
重建虛擬機器丟失的虛擬磁碟vmdk頭 描述檔案
本文主要介紹如何重建vmdk檔案所丟失的頭 描述檔案 以下情況需要我們重建乙個vmdk檔案丟失的頭 描述檔案 1 通過datastore瀏覽vmfs目錄時找不到虛擬機器的vmdk檔案 2 當利用命令列介面檢視時無法找到 flat.vmdk檔案存在 3 vmdk的描述檔案不存在或被損壞了 4 開啟虛擬...
VMware 虛擬機器磁碟
建立磁碟時,會進行兩個操作 分配空間 置零 1 厚置備延遲置零 預設的建立格式,建立磁碟時,直接從磁碟分配空間,但對磁碟保留資料不置零。所以當有i o操作時,只需要做置零的操作。磁碟效能較好,時間短,適合於做池模式的虛擬桌面 2 厚置備置零 thick 建立群集功能的磁碟。建立磁碟時,直接從磁碟分配...