時間同步伺服器優化方案
一. 當前問題及結構描述:
1) 主、備2臺時間伺服器,分別和不同官方源同步校正時間;
2) 暢遊所有伺服器,只和主時間伺服器做同步;
3) 備時間伺服器,作用是提供主時間伺服器內網校正和比對監控,當主備差異時間超過30秒,會預警;
但備時間伺服器不提供熱切換功能
4) 本次問題根本原因:主時間伺服器硬體損壞,無法連上;導致線上時間同步機制失效
二. 優化方案:
1. 優化後結構(紅色為優化部分):
1) 通過keepalive機制,配置原時間主伺服器的ip為前端虛ip (業務線影響最小化),綁在其中1臺時間伺服器上
2) 後端2臺時間伺服器,通過北顯機房2個私網ip實現心跳監聽;當時間服01宕機,會把前端虛ip熱漂移到另一台時間服02,對外ntp同步服務不受影響,01和02的時間同步頻率為10秒一次
3) 增加同步機制有效性監控,時間相差1秒或者同步不成功及時告警
當前時間同步伺服器結構圖:
優化後時間同步伺服器架構:
2. 優化後說明:
優化前優化後
備註時間同步機制
業務和主時間伺服器做同步
業務和時間同步服務前端vip做同步
業務線同步方式不需要修改
時間同步冗餘互備
主時間伺服器
單點前端vip後面對應2台主備冗餘時間伺服器,2臺之間誤差小於1秒
新增主備熱切換機制,避免單點故障
監控方式
ø 主備時間伺服器時間差小於30秒
ø 主時間伺服器宕機監控
ø 主時間伺服器ntp服務監控
ø 所有監控都有郵件報警
ø 時間準確性監控:
l 與外部官方源每64秒同步一次
l 主備時間伺服器時間差處於毫秒級,誤差超過1秒告警,超過5秒停止服務並報警
ø 服務監控:
l ntp服務監控,服務或程序丟失立刻報警keepalived服務監控,服務或程序丟失、發生「腦裂」立刻報警
l 各機房時間同步監控,確保各機房都能與時間伺服器同步,同時確保時間同步服務可用
ø 物理伺服器監控:
l cpu、記憶體、磁碟監控、溫度、電源、raid卡
l 及時更換過保機器
1) 上述優化方案,已在測試機驗證可行;
2) 方案優點:能實現的是2臺時間伺服器互備,不再因單點故障影響時間同步服務;
3) 新方案實施:
a) 根據計畫排期,從小專案實施,逐步分批替換現有業務的時間同步機制,預計1月底完成;
b) db伺服器時間同步方式修改為ntpd服務方式進行,這樣可以避免時間立即同步成正確時間,造成業務影響,會把時間差分多次進行平滑同步;
同步兩台linux伺服器時間同步方案
linux自帶了ntp服務 etc init.d ntpd,這個服務不僅可以設定讓本機和某台 某些機器做時間同步,他本身還可以扮演乙個timeserver的角色,讓其他機器和他同步時間。配置檔案就是 etc ntp.conf。為了測試,設定讓node2 192.168.1.102和node1 192...
windows域中時間同步的解決方案
在windows 2003 active directory 架構的域當中。當客戶端加入域後。那麼域控制器就是乙個time master,作為客戶端的乙個time source。理論上客戶端會自動與dc進行時間同步。但實際,當客戶端的時間發生變化後。是不能自動與域控制器進行時間同步的。要實現這個目的...
windows域中時間同步的解決方案
在windows 2003 active directory 架構的域當中。當客戶端加入域後。那麼域控制器就是乙個time master,作為客戶端的乙個time source。理論上客戶端會自動與dc進行時間同步。但實際,當客戶端的時間發生變化後。是不能自動與域控制器進行時間同步的。要實現這個目的...