618大促已過,618備戰以及活動總結同步如下:
一、前期準備
1、 梳理上下游依賴,如上游介面不可用確認對上游是否相應預案,當我們介面不可用下游是否有相應預案。
2、 梳理降級預案、redis、資料庫等,主要是使用的redis集群有哪些,核心redis集群和資料庫是哪些,此次雙11活動
前2個月各種問題頻發,配合redis方做了集群擴容、集群構建獨立分割槽,雙11當前redis很穩定。
3、 摘機壓測,主要為測試單機能承載的流量,理論上乘以容器數即為該服務可承載流量,實際上大促時整個
機房網路、容器所在物理機cpu、記憶體、網路等外部條件會發生變化,故單機壓測是必要的,但還是需要上
下游聯合壓測
4、 效能優化,壓測後會發現效能問題,需要進行優化,不然擴容後問題可能會被放大,進而影響系統穩定性。
5、 流量預估,根據618會議以及上下游溝通以及當前流量預估流量。
6、 上線遊壓測,降級預案演練,此時壓測主要根據預估的流量上下游進行壓測,壓測時會進行多個回合,一般
第一回合壓測到最大極限值,cpu、記憶體等90%或tp99 500以上,第二回合我方降級後壓測看極限值,第三回
合壓測我方恢復下游進行降級演練。壓側後記錄相應壓測量資訊。
7、 擴容,根據流量預估單機壓測、聯合壓測進行擴容,擴容需每個業務根據流量情況進行相應壓測。
8、 聯合壓測,擴容後根據流量還要進行壓測,並會根據壓測對各個業務間進行調配。
9、 redis穩定性、服務邏輯梳理、活動開始前上線業務review,活動前對redis、依賴服務以及鄰近大促上線業務要進行
詳盡review,確保不要在鄰近上線時引入問題,此時引入修改風險大。
二、活動開始
1、6月1日凌晨跟進流量,線上服務效能、穩定性、可用性跟進。記錄流量等指標。
2、6月17日集團值班,跟進9:00開始每個整點流量以及系統效能、穩定性指標。並根據當晚8:00 10:00流量對降級預案
進行調整,並同步相關人員知曉。
3、晚10點後可根據業務特點對相應業務進行重啟以及關閉日誌操作,以服務最好狀態迎接0點大促。
4、一般降級在23:55進行,0:05通知上線遊進行恢復,此次618未進行降級操作。
三、活動總結
1、總結備戰、活動開始過程中的相應問題,按照優先順序進行排期處理。
2、總結備戰過程作為下次備戰參考。
3、記錄相應資料,已做後續大促,以及同步大家知曉。
四、此次618相應問題已構建事項列表,有些項已進行溝通,並開發中,有些已溝通,每件事進度會一直進行跟進。詳見附件
五、大促重要的是前期準備梳理以及各項壓測以及**review等工作、重要的前期各項工作做細,因為大促時人會比較緊張,
指望臨場去應急處理引起更大問題,出錯風險很大。
ACM備戰知識點總結
線段樹詳解 字串相關知識 g i 1 代表從g i 1 開始賦值 char g 105 105 for int i 1 i n i 慎用map,會超時!我藍橋杯就是因為用了map超時了,計算不出結果,我當時不知道是因為map,導致自己錯過了10分,錯過了省一。設定格式 iomanip是i o流控制標...
備戰ACM ICPC資料
一 知識點 資料結構 1,單,雙鏈表及迴圈鍊錶 2,樹的表示與儲存,二叉樹 概念,遍歷 二叉樹的 應用 二叉排序樹,判定樹,博弈樹,解答樹等 3,檔案操作 從文字檔案中讀入資料並輸出到文本文 件中 4,圖 基本概念,儲存結構,圖的運算 數學知識 1,離散數學知識的應用 如排列組合 簡單的圖論,數 理...
備戰藍橋 the first question
問題描述 考慮如下的序列生成演算法 從整數 n 開始,如果 n 是偶數,把它除以 2 如果 n 是奇數,把它乘 3 加1。用新得到的值重複上述步驟,直到 n 1 時停止。例如,n 22 時該演算法生成的序列是 22,11,34,17,52,26,13,40,20,10,5,16,8,4,2,1 人們...