這是上個問題f85報0518錯誤的後續:
主機接管問題處理步驟:
一、 主備機ha執行正常,進行備機停ha,主機進行接管的測試。
二、 備機執行#smitty clstop 選擇takeover 來停ha,#tail –f/tmp/hacmp.out 觀察輸出情況。
三、 備機顯示ok後,#netstat –in 看到服務ip已經下去,#lsvg –o,p204vg也已經varyoff下去;在主機端,執行#netstat –in 看到服務位址已經起來, #lsvg –o , p204vg 也已經varyon起來了,但是檔案系統/oracledata/p209_db無法 mount起來。
四、 在主機端發現lv裝置有異常,/dev目錄下無p204lv的塊裝置檔案和與其想對應的loglv01的塊裝置和字元裝置檔案。手工建立這三個裝置檔案:#mknodp204lv b 44 2 ;(後來想想,應該效果等同於importvg)
#mknod loglv01 b主號 副號(當時沒記下來,可以進入/dev ,然後ls –l |greplv 看到主號和副號);#mknodloglv01 c 主號 副號。這樣三個裝置檔案就建立好了,備機重起ha將資源拉回。
五、 重新進行接管測試,檔案系統還是mount不起來,對比主備機的/etc/filesystems檔案 發現主機的filesystems檔案中沒有/dev/p209lv一節.在主機端:#cp/etc/filesystems /etc/filesystems.old ,#vi /etc/filesystems 手動加上/dev/p209lv一節 。
六、 備機重起ha,將資源拉回後,再進行接管測試,ok 至此,主備機的接管測試完全通過。
HACMP問題檢查
a機 b機hacmp不能相互接管,一般主要表現在兩個方面 1 雙機的hacmp引數配置 某些系統引數的配置以及雙機應用環境設定是否符合實際需求 2 接管時,占有資源的機器是否能合理地釋放資源hacmp為我們測試高可用性環境提供了乙個很有用的工具,這就是停止hacmp的一種方式 gracefulwit...
HACMP工作原理
author skate time 2009 12 07 hacmp工作原理 hacmp將診測並響應於三種型別的故障 1網絡卡故障,2網路工作,3節點故障。下面就這三種故障分別進行介紹。1 網絡卡故障 前面講到,hacmp的群集結構中,除了tcp ip網路以外,還有乙個非tcp ip網路,它實際上是...
zookeeper c api連線管理問題
背景 使用zookeeper3.4.8 的 c api寫了乙個客戶端來測試zookeeper集群 在測試到其中乙個點的時候,遇到一些困惑 假如zookeeper集群啟動了三個zookeeper例項,對應ip埠分別是 host1 port1,host2 port2,host3 port3 然後在客戶端...