具體來說,
一、2013
年主要完成了如下工作: (1
)完成pp等合作方應用和
a端**完美融合方案的推進及實施(感謝xx支援); (2
)完成pt全自動發布系統的上線及pg組線上發布系統的改進(確實很提高工作效率); (3
)規劃並構建了線上線下堪稱完美的**池解決方案(
adsl
及光纖固定
ip),並大規模應用在pg
、pt及xn的業務中; (4
)重新構建線上日誌分析平台,並在現有基礎上進行同步優化,在可控的條件下,方便開發童鞋檢視線上業務運**況; (5
)豐富現有
cacti/nagios
監控系統,增加
raid
健康監控、故障自恢復、觸發指令碼的功能(
fpm故障自重啟、xx出口流量超標自動抓包); (6
)完成內網虛機資源的有效整合,用
2台高配伺服器代替了原來
12台老舊伺服器,有效減輕機房電力及散熱的壓力; (7
)隨著公司業務量的增長
hadoop
集群進行擴容公升級; (8
)對現有系統做了一些優化工作(平台
xx/xx
庫的自動優化,
sphinx由32
位公升至64
位,xx機房內網流量繞路問題,聯通
google dns
穩定性對平台影響); (9
)根據公司業務需求上線了一批伺服器;
(10)線上資料庫單點登入系統
sso的實施,方便非
dba運算元據庫;
(11)svn
賬號管理方式的公升級(
passwd
檔案整合及使用者修改密碼功能);
(12)順利完成了臨時性及開發、測試童鞋的各種運維需求;
(13)日常運維管理工作。
二、2013
年遇到的幾個比較重大的突發問題及解決方案: (1
)php-fpm
資源耗盡?
運維這邊主要做了:增加對fpm
的監控、
fpm故障自重啟、
fpm按應用分
pool;
開發那邊也做了些工作,最近幾個月沒有出現異常。 (2
)xx機房受到大流量
ddos
攻擊?
參見郵件:《關於2013-4-13
公司伺服器收到突發大流量攻擊分析報告及解決方案 》。 (3
)伺服器硬體故障(pg
65主機板、pt
18及主庫磁碟、
hadoop
磁碟、舊機器主機板風扇故障)?
在不影響業務及影響最小的情況下對發現的故障硬體及時更換。 (4
)hadoop
集群資料丟失?
參見郵件:《hadoop
集群事故預防方案 》。 (5
)公司自建機房空調不給力導致
hadoop
集群及虛機不時停機?
推動實施虛機資源整合計畫,減少開機數量、協調人力部門及時更換空調、增加排風扇。
三、2013
年也較深刻的思考過、嘗試過下面幾個問題的解決,但還沒成體系: (1
)dns
的管理方式的改進(**機別名和泛網域名稱站群)及公司線上線下
dns體系的設計; (2
)儲存分層的思想及冷儲存; (3
)sql
慢查詢分析推送系統
(可擴充套件到應用的
error log);
(4)開源堡壘機功能擴充套件(許可權控制、錄屏審計、
sudo (5
)跨機房網路互連
vpn方案(
access/lan to lan);
(6)自建可擴充套件
ad**池(不採用飛魚星的多
wan口路由器,類似
pfsense
但功能不同); (7
)關於做事情的
5w+1h
理論(what->why->when->where->who->how)
四、2013
年個人方面也通過學習拿到了紅帽
rhce
及思科ccnp
認證。
五、展望2014
,目前的工作計畫: (1
)第一要務確保線上線下穩定執行; (2
)第二要務應對突發狀況; (3
)有選擇的完成
2013
年深刻的思考過的那幾個問題; (4
)豐富運維管理系統,讓運維工作更加流程化、規範化。
2023年 年終工作總結
轉眼13年就要結束,今年工作給自己的感覺就是累,不知所謂。從年頭就開始準備的專案,各種原因遲遲無法到客戶現場開發,各種條件成熟了,開發人員可以進場開發,從9月開始,十月回公司,十一再次現場開發,十二月回公司,回公司後客戶提出一堆需求,需求要在一月中完成。在這個過程中作為負責人存在不少問題 1.4月開...
2023年,年終工作總結
一 工作總結 1 2012年度工作中取得的主要業績 成果和收穫 擔任yz工作室策劃期間,負責以下系統或玩法的設計與實現跟進 世界boss,幫會boss,野外boss,三個無腦副本,qs大作戰,守護xl,天降財神,復活系統,掛機系統,怪物ai,套裝屬性等。擔任yz工作室專案助理期間,負責測試組和策劃新...
2023年中工作總結及工作計畫20150728
從4月8號正式加入到 鳥團隊以來,主要完成了如下5項工作 2 完成 鳥新系統的規劃 部署 上線及新老系統的切換等一系列工作,目前已完全切換新系統執行 3 梳理並標準化了一些日常的操作 nodejs執行所需環境的安裝 將node mongo等啟停的命令封裝為服務 將所有服務的執行許可權有root降為普...