大資料平台監控服務及自動重啟指令碼

2021-10-01 08:18:23 字數 2291 閱讀 2028

我們知道大資料平台有很多服務datanode,namenode,nodemananger,resourcemanager等等,這些服務可能會在跑任務的過程中直接退出,那麼我們如何監控這些服務並重啟服務呢?接下來總結一些這方面的監控指令碼以備不時之需。

1、datanode監控(hadoop_datanode_monitor.sh)

#!/bin/bash

source $home/.bashrc

function logger()

#monitor base functionfunction proc_monitor()

#minitoring datanodeproc_monitor "datanode"

2、namenode監控(hadoop_namenode_monitor.sh)

#!/bin/bash

source $home/.bashrc

function logger()

#monitor base functionfunction proc_monitor()

#minitoring namenodeproc_monitor "namenode"

3、nodemanager監控(hadoop_nodemanager_monitor.sh)

#!/bin/bash

source $home/.bashrc

function logger()

#monitor base functionfunction proc_monitor()

#minitoring nodemanagerproc_monitor "nodemanager"

4、resourcemanager監控(hadoop_resourcemanager_monitor.sh)

#!/bin/bash

source $home/.bashrc

function logger()

#monitor base functionfunction proc_monitor()

#minitoring resourcemanagerproc_monitor "resourcemanager"

5、hmaster監控(hbase_master_monitor.sh)

#!/bin/bash

source $home/.bashrc

function logger()

#monitor base functionfunction proc_monitor()

#minitoring masterproc_monitor "master"

6、hregionserver監控(hbase_regionserver_monitor.sh)

#!/bin/bash

source $home/.bashrc

function logger()

#monitor base functionfunction proc_monitor()

#minitoring regionserverproc_monitor "regionserver"

大資料平台監控服務及自動重啟指令碼

我們知道大資料平台有很多服務datanode,namenode,nodemananger,resourcemanager等等,這些服務可能會在跑任務的過程中直接退出,那麼我們如何監控這些服務並重啟服務呢?接下來總結一些這方面的監控指令碼以備不時之需。1 datanode監控 hadoop datan...

windows服務監控及重啟指令碼

1 本篇目的 監控指定windows服務,停止後重啟。1 echo off 2rem 定義迴圈間隔時間和監測的服務 3set secs 600 4set srvname dot3svc 5 6echo.7 echo 8 echo 查詢計算機服務的執行狀態 9 echo 每間隔 secs 秒鐘進行一次...

大資料監控平台實踐之路

二 架構設計 influxdb grafana 大資料監控平台實踐之路 監控粒度 監控指標完整性 監控實時性是評價監控系統的三要素。從分層體系可以把監控系統分為三個層次 業務系統本質目的是為了達成業務目標,因此監控業務系統是否正常最有效的方式是從資料上監控業務目標是否達成。對業務運營資料進行監控,可...