linux伺服器集群運維經驗

2021-09-21 23:06:20 字數 1080 閱讀 2107

以下是自己在運維工作中的一點經驗和看法,希望對大家有所幫助

2.系統的的自動安裝,主要有kickstart和cobbler

3.統一的yum源和定製化的rpm包,並整合至yum源站,為後續的環境初始化做軟體上的準備

4.構建專屬於自己的內網dns

5.標準化的統一的命名方式(標準化基礎),便於使用puppet管理,並且減少操作的錯誤,如果每個機器的hostname都為localhost,那將是乙個多麼可怕的事。。。在我們的生產環境中主要使用下面這種命名方式

機房-主業務-應用程式-ip後兩位-公司網域名稱,這樣一眼就可以看出是哪台伺服器,應用於什麼業務,報警也可以直接定位。

6.自動化的配置管理和環境部署工具:puppet,puppet的模組編寫要儘量減少模組直接的耦合度,並使用class繼承的方式來減少運維的工作量,定製化的facter變數會使軟體的配置環境更加靈活,由於puppet暫時不支援群集,所以在實際應用中需要部署多套,根據經驗,1500臺左右的server時puppet會出現效能問題。

7.強大有效的監控系統,在生產環境中我們使用了zabbix proxy+zabbix master的群集結構,zabbix可以實現有效的系統和應用級別的監控,應用監控同時也使用了ppmon來實現多點監控。

選擇zabbix有乙個最大的好處,就是監控資料是存放在資料庫中的,這樣就可以利用資料庫中的資料做很多操作,比如可以分析一段時間內伺服器的各個效能指標,檢視伺服器的資源利用率,可以對資料進行聚合操作,從而分析全網的指標,比如總的流量,總的http code分布情況。

8.日誌收集伺服器群集和qos分析系統,構建有效的日誌收集系統可以有效地對使用者的訪問資料進行整合和分析,可以快速的分析qos,對應重要的節點我們採用本地分析並匯入mongodb,最後匯入zabbix的方式,非重要節點則直接將日誌打包壓縮,通過ftp上傳至hadoop資料倉儲集群中。

9.構建冗餘的結構,消除單點,在生成環境中對於一些重要節點都採用keepalived-ha的方案來提高冗餘度。對於resin,php等應用伺服器則在前端使用nginx做反向**,同時nginx使用keepalived-ha

10.自動化的**分發系統,主要是controltier + svn的使用,可以方便快速地部署**。

Linux運維 有關伺服器

一 什麼是伺服器?提供計算服務的裝置,和電腦幾乎相同。由於伺服器需要響應服務請求,並進行處理,因此一般來說伺服器應具備承擔服務並且保障服務的能力。根據伺服器的網路規模 伺服器檔次,可以將伺服器分為三種級別 入門級伺服器 部門級伺服器和企業級伺服器 級別從低到高 在網路環境下,根據伺服器提供的服務型別...

伺服器運維

運維 網際網路運維,通常屬於技術部門,與研發 測試 系統管理同為網際網路產品技術支撐的4大部門,這個劃分在國內和國外以及大小公司間都會多少有一些不同。產品的整個生命週期裡運維的職責重要而廣泛,但運維工程師們的職責不僅限於這部分工作,還需要總結工作中遇到的問題,抽取出相關的技術方向 研發相關的工具和平...

python運維伺服器

好久沒有寫東西了.一直做伺服器開發需要寫一些指令碼來控 務器的啟動.本來windows自帶了任務計畫,但不是特別方便,還是用python寫了一下.需求 在固定的時間啟動伺服器 先看源 def start process date cwd os.getcwd global list threads g...