公司2023年架設的一套10 g rac,安裝當時的規劃db_files設定了200,近期由於生產旺季,資料檔案增大,需要將這個引數調整為1000,
接受這個case時覺得沒什麼難的,隨即申請停機時間15分鐘;
到了停機時間,登入rac的node2執行
sql> alter system set db_files=1000 scope=spfile;
隨後正常關閉rac
執行開啟rac過程,asm,nodeapps開啟後,在執行開始例項時,丟擲乙個crs的錯誤,隨後檢視alter.log日誌,發現data4沒有mount,好奇怪哦
生產還等著呢,距停機時間還有8分鐘呢,排錯吧
方法1:
先將node1的data4手動mount起來,node1正常啟用,然後再mount node2上data4
這時由於大量生產客戶端已經和在node1產生連線,導致了node2無法mount;
方法2:
依次關閉nodeapps,asm,根據alter.log提示,檢查asm例項的pfile,問題出現了,data4沒有被寫入到檔案,隨後在2個節點都加入data4,啟動ok!
終於想起來了,2023年11月左右一同事新增2tb的data4,估計是當時作業沒有完成!
asm diskgroup新增與刪除步驟見博文:
至問題解決,超過了申請停機時間6分鐘,屬於嚴重生產事故,被boss大罵一頓!
總結一下:
1.任何db維護需求,需dba team協調溝通;
2.在接受本次維護任務時,最好能看一下該db最近維護記錄,小心觸發別人的錯誤,導致自己被k!
修改單例屬性引發的血案
最近接觸的一些系統中遇到乙個問題,乙個交易的服務對外提供了支付和退款兩種能力,但是發現執行時交易的服務走了退款。原因是spring容器管理的乙個物件service 屬性執行時被改變,導致上下流程對不上的問題,多業務鏈路併發時引發執行時屬性錯亂,導致 支付和退款行為混淆 下面是大體 樣例。記錄下問題原...
乙個引數引起的血案
問題產生實際情況 資料庫被強制乾掉,空間漲到100 分析 經觀察發現是由於pg log目錄增長過快導致磁碟空間被爆。pg log是如何產生的?記錄資料庫執行日誌,內容可讀,預設關閉,需要設定引數啟動。1.error資訊。2.定位慢查詢sql。3.資料庫的啟動關閉資訊。4.pg系統相關警告資訊等。根據...
修改mysql引數 mysql動態修改引數
mysql資料庫可以動態的修改引數,即可以修改會話級變數只對當前會話產生影響 又可以修改全域性變數,對所有新連線的會話都產生影響。1 修改全域性變數 root admin root mysql mysql show variables like sort buffer size variable n...