在主機層面大多需要檢查的是作業系統版本,相應的hba卡是否達到合適的標準,如速率、iops及頻寬等。其次是在主機上安裝的多路徑軟體,檢視一下與儲存裝置連線的物理路徑的狀態以及儲存lun等資訊。
二、網路層
網路層次可能發生的問題大多是連通性問題,由於鏈路故障導致的丟包或者誤位元速率上公升等現象,此現象可以在交換機上觀察埠的資訊,觀察誤位元速率是否在持續增長,如有,則可能存在鏈路部件異常或接觸不良的現象。其次可能是埠速率或頻寬未達到標準,檢視埠配置及協商狀況,這些都有可能導致故障或者效能問題。
三、儲存層
儲存裝置可以在匯出相關告警,事件或者執行資料、系統日誌和硬碟日誌來進一步分析可能發生故障的原因,到底是儲存控制器問題還是底層的硬碟問題都需要一一排查。在底層儲存方面主要考慮儲存模組的配置,指示燈狀態等資訊,從指示燈狀態我們可以分析出是否存在硬體故障等,其次在配置方面:raid級別、分條深度、lun讀寫策略、cache策略,lun歸屬、硬碟型別等是否符合業務的特點以及不符合時可能導致的問題。都是需要我們在故障排查處理時需要考慮的。
總之面對儲存系統的故障,一定要具備乙個清晰的思路,不要盲目的去做。盲目的去做可能會惡化故障,從而使得排查難度進一步加大。
資料中心儲存系統故障的處理方式
儲存系統作為如今大資料雲計算時代的根基,它的穩定才是支撐起如此海量資料的根本。所以各大相關行業對於這部分非常重視,所以在此針對儲存系統的故障處置簡單提出自己學習總結的一些思路。首先在處理儲存系統發生的可能故障前必須對於整個儲存系統的架構以及原理有乙個清楚的了解。普遍來說儲存系統由主機 交換機及儲存裝...
如何解決AIX的檔案系統故障
在進行檔案系統維護和管理過程中,會碰到這樣一些問題,例如無法安裝檔案系統或者無法拆卸檔案系統,當檔案系統的超級塊被破壞,而無法正常使用檔案系統,如何修復rootvg中的主要檔案系統,下面就討論如何解決一些常見的檔案系統問題。一 恢復超級塊錯誤 修復該檔案系統時,出現下面錯誤提示,並異常終止 fsck...
炙手可熱 資料中心該如何「降溫」?
資料中心存在多年,對資料中心的發展我們應該抱以歡迎的態度,但也不能過分浮誇,給資料中心亂戴帽子。資料中心只是資訊科技發展過程的必然產物,如何適應其發展節奏,讓資料中心真正地高效運轉起來,這才是正道。資料中心的概念隨網際網路進入中國,第一次掀起了建設資料中心的熱潮,這也決定了其發展過程中伴隨著網際網路...