如何解決AIX的檔案系統故障

2021-09-20 19:37:58 字數 2988 閱讀 6707

在進行檔案系統維護和管理過程中,會碰到這樣一些問題,例如無法安裝檔案系統或者無法拆卸檔案系統,當檔案系統的超級塊被破壞,而無法正常使用檔案系統,如何修復rootvg中的主要檔案系統,下面就討論如何解決一些常見的檔案系統問題。

一、恢復超級塊錯誤

修復該檔案系統時,出現下面錯誤提示,並異常終止: #fsck /dev/lv1

not a recognized filesystem type. (terminated) 

要解決這個問題,只能用備份的超級塊來恢復主超級塊,我們都知道,在檔案系統中,1號邏輯塊是主超級塊,31號邏輯塊是備份超級塊,因此就把31號邏輯塊上的內容寫到1號邏輯塊上去。

例如檔案系統對應的邏輯卷為/dev/lv1,則恢復該檔案系統的超級塊命令如下:

#dd count=1 bs=4k skip=31 seek=1 if=/dev/lv1 of=/dev/lv1 

當恢復完成,就要用fsck命令來檢查檔案系統的完整性:

#fsck  /dev/lv1

** checking /dev/rlv1 (/allen)

** phase 0 - check log

log redo processing for /dev/rlv00

** phase 1 - check blocks and sizes

** phase 2 - check pathnames

** phase 3 - check connectivity

** phase 4 - check reference counts

** phase 5 - check inode map

** phase 6 - check block map

9 files 608 blocks 15776 free

在許多情況下,通過恢復備份超級塊到主超級塊可以解決這個問題,使檔案系統處於正常工作狀況下。如果這樣做還不能解決問題,那只能刪除檔案系統,然後重新建立檔案系統,再恢復備份的資料。

二、無法拆卸檔案系統

如果有使用者或程式在乙個檔案系統中活動,就無法拆卸這個檔案系統,當使用拆卸命令時,會提示下面的錯誤:

device busy 或者 a device is already mounted or cannot be unmounted 例如由於安裝程式的異常終止或其它原因經常會遇到不能正常釋放光碟機(光碟機是cdrom檔案系統)的問題,當使用者再次訪問光碟驅動器時就產生錯誤 0514-062: 指定的裝置忙。

按照下面的步驟去解決:

1、檢查使用者自己的當前工作目錄是否在這個檔案系統中,如果是,則用cd /命令使當前工作目錄回到根目錄,然後再試著拆卸檔案系統;

2、如果還是不能拆卸檔案系統,可能在檔案系統有檔案正在被開啟使用,因此在拆卸檔案系統之前應該關閉這些檔案。有時候可能還有一些程序在使用這個檔案系統的資源,可以使用fuser命令來檢查有那些程序仍然在這個檔案系統中活動。fuser命令將顯示在這個檔案系統中正在活動的所有程序id號。下面就fuser命令使用的例子:

#fuser  /dev/cd

/dev/cd: 2910 3466  

如果使用fuser –u /dev/cd將在程序號後指出使用者名稱。如果root使用者用fuser –k /dev/cd命令,則給這些程序發出sigkill訊號,來殺死這些程序。然後用kill命令將這些正在活動的程序殺死,然後再試著拆卸檔案系統。例如: #kill –9 2910 3466 

這時您可以用下面命令檢查裝置的狀態是否為可用: #lsdev -cc cdrom  

或者 #lsdev –c –l cd0  

(若為其它檔案系統,將cd0換為檔案系統的邏輯名)如果裝置狀態為可用,您就可以使用該裝置或解除安裝檔案系統。

3、如果檔案系統仍然處於忙狀態,不能被拆卸,可能是在這個檔案系統中載入了乙個核心擴充套件,這種情況用fuser命令無法檢查到核心擴充套件,系統提供了乙個檢查核心擴充套件的工具——genkex,用這個命令可以顯示目前已載入的所有擴充套件核心。

4、如果在乙個檔案系統還安裝了另乙個檔案系統,則要直接拆卸這個檔案系統也是不能成功,必須先將該檔案系統中所有安裝的檔案系統拆卸掉,才能拆卸自己。使用mount命令檢視有那些檔案系統還在安裝在系統上,然後根據安裝點將安裝在這個檔案系統中的所有其它檔案系統用umount命令拆卸掉,再試著拆卸自己。

三、 無法刪除檔案系統

當乙個檔案系統可以用mount命令安裝或用unmount拆卸,但是無法刪除該檔案系統,在刪除時,系統會報如下錯誤

: 0516-306:get lvodm: unable to find in the device confgiguration data. 發生此錯誤的原因可能是odm資料庫中的定義與實際不一致。可以用下面命令檢查該檔案系統的型別:

#lsvg -l rootvg 

若型別顯示為???,則用synclvodm -p rootvg 和 syncvg -v rootvg 命令對捲組進行同步,之後,再用命令 lsvg -l rootvg 顯示出正確的檔案型別。此時可以成功刪除該檔案系統。

四、 修復rootvg中的主要檔案系統和日誌

如果要檢查和修復rootvg中的/、/tmp、/usr、/var檔案系統,必須先將它們解除安裝,然而在正常的多使用者環境下是無法解除安裝這些檔案系統,要完成這些工作必須在維護模式下進行。

如果當前的aix是aix 3.2.4或3.2.5版本,還必須設定odmdir環境變數,命令如下:

#odmdir=/etc/objrepos;export odmdir 

執行fsck命令清理檢查上面提到的檔案系統,命令如下:

#fsck /dev/hd4 #fsck /dev/hd2 #fsck /dev/hd3 #fsck /dev/hd9var 

當然也可使用其fsck選項。如果rootvg中預設檔案系統的日誌(jfslog)即/dev/hd8有問題,這時也可以重建它,命令如下:

#logform /dev/hd8 

然後會提示您是否繼續初始化,如果回答y,以前在/dev/hd8上的日誌資訊就被清掉。初始化成功後,輸入exit命令就退出單使用者模式,根據提示按回車進入多使用者模式,這些檔案系統會自動被安裝上。最後用shutdown命令關閉系統。

資料中心儲存系統故障該如何解決

在主機層面大多需要檢查的是作業系統版本,相應的hba卡是否達到合適的標準,如速率 iops及頻寬等。其次是在主機上安裝的多路徑軟體,檢視一下與儲存裝置連線的物理路徑的狀態以及儲存lun等資訊。二 網路層 網路層次可能發生的問題大多是連通性問題,由於鏈路故障導致的丟包或者誤位元速率上公升等現象,此現象...

監控系統故障的解決方法

1.電源的不正確引發的裝置故障。電源不正確大致有如下幾種可能 供電線路或供電電壓不正確 功率不夠 或某一路供電線路的線徑不夠,降壓過大等 供電系統的傳輸線路出現短路 斷路 瞬間過壓等。特別是因供電錯誤或瞬間過壓導致裝置損壞的情況進有發生。因此,在系統除錯中,供電之前,一定要認真嚴格地進行核對與檢查,...

伺服器zfs檔案系統故障資料恢復過程

伺服器在正常執行的時候突然崩潰,沒有斷電 進水 異常操作 機房不穩定等外部因素。伺服器管理員對裝置進行重啟後發現無法進入系統,需要對伺服器內的資料進行恢復。伺服器管理員對所有硬碟進行扇區級映象後將映象檔案送到資料恢復中心進行資料恢復。伺服器資料恢復工程師對客戶的故障伺服器進行底層資料分析得到如下資訊...