slurm 系統管理
使用slurmdbd進行記賬管理,首先需要安裝mysql服務
$ sudo apt-get install mysql-server
$ sudo apt-get install libmysqlclient-dev
使用原始碼安裝slurm
$ cd slurm
$ ./configure --prefix=/usr --sysconfdir=/etc/slurm
$ make
$ sudo make install
如果需要開機啟動,將slurm/etc資料夾下的 init.d.slurm拷貝到/etc/init.d/slurm中,
對於ubunt系統,需要在init.d.slurm中修改,其中的/etc/rc.d/init.d/functions修改為
『/lib/lsb/init-fuctions』即可,對於slurmdbd服務,將slurm/etc/init.d.slurmdbd拷貝到 /etc/init.d/slurmdbd中,與init.d.slurm做同樣的修改。
然後需要修改slurm.conf和slurmdbd.conf檔案,將其拷貝到/etc/slurm資料夾下。
修改完以後對slurm.conf和slurmdbd.conf進行修改
對slurm.conf的修改部分
accountingstoragetype=accounting_storage/slurmdbd
accountingstorageuser=slurm
accountingstorejobcomment=yes
新增slurmdbd.conf
authtype=auth/munge
dbdaddr=localhost
dbdhost=localhost
#dbdport=7031
slurmuser=slurm
#messagetimeout=300
debuglevel=4
#defaultqos=normal,standby
logfile=/var/log/slurm/slurmdbd.log
pidfile=/var/run/slurmdbd.pid
#plugindir=/usr/lib/slurm
#privatedata=accounts,users,usage,jobs
#trackwckey=yes
storagetype=accounting_storage/slurmdbd
storagehost=localhost #mysql所在的伺服器
storageport=1234 #埠
storagepass=password #登入密碼
storageuser=slurm #使用者
#storageloc=slurm_acct_db
在mysql中建立相應的使用者
$ mysql -u root -p
mysql> insert into mysql.user(host,user,password) values("localhost","slurm",password("password"));
mysql>grant all on slurm_acct_db.* to 'slurm'@'localhost';
然後就可以啟動slurm和slurmdbd服務了
$ sudo /etc/init.d/slurm start
$ sudo /etc/init.d/slurmdbd start
sacctmgr管理
使用sacctmgr可以將使用者關聯到不同的集群,賬戶上,sacctmgr可以管理多個集群,首先應通過sacctmgr命令
1. 向記賬資料庫中新增所管理的集群資訊
# sacctmgr add cluster name=name [option=value]
option 包括集群類別,公平份額,資源限制,qos等設定
可以通過sacctmgr list cluster檢視集群資訊,修改集群資訊可以如下
# sacctmgr modify cluster where name=clustername set modifyattribute=value
刪除# sacctmgr delete cluster clustername向記賬資料庫新增賬戶,賬戶為系統對使用者的一種組織方式,可以通過將同一單位或者組織的使用者新增到同乙個
賬戶中來實現對該單位或者組織使用集群的資源作出限制,在賬戶中還可以新增子賬戶,新增賬戶
# sacctmgr add account name=accountname [option=value]
option 包括集群,組織單位,描述,父帳號,公平份額,資源限制,qos
賬戶也可以通過對應的命令進行修改和刪除
3. 向記賬資料庫中新增使用者,當slurm.conf中accountingstorageenforce設定為 associations時,
只用新增到記賬資料庫中的使用者才能向集群提交作業。新增使用者
# sacctmgr add user name=username [option=value]
option 包含集群,賬戶,預設賬戶(乙個使用者可以天到多個賬戶中),負載特性,分割槽,管理級別,公平份額,資源限制,qos
作業的qos
qos為服務質量,由系統管理員定義,命名,然後在使用者使用時通過名字使用不同的qos。qos可以進行資源限制,作業提交檢查,如限制提交作業數,限制節點或者處理器數,執行時間限制等,作業排程檢查,超出qos限制的作業不能執行,作業執行中檢查等。建立qos
# sacctmgr add qos qosname where value=value
使用者在提交作業時可以選擇qos,如未指定,使用賬戶關聯的qos,否則使用預設qos。
SAP BASIS系統管理
系統監控 1 sm51 2 sm50 3 sm66 系統日誌 1 sm21 sap ccms 1 rz20 2 st06 作業系統監視器 operating system monitor 用於分析整個sap技術棧的效能 4 ssaa 用於執行常規的日 周和月的系統管理功能。5 smlg 用於監控sa...
Oracle 系統管理
oracle 系統管理 1.oracle的啟動和關閉 說明 這裡所說的啟動和關閉是對於 oracle 例項而言,而不是對於 oracle 服務而言。如果 oracleserviceorcl 服務未開啟,則會報 ora 12560 tns 協議介面卡錯誤 而且啟動和關閉需要有 dba許可權才能操作,否...
UNIX系統管理
一 進場管理 1 查詢程序執行狀況 ps 命令 解釋ps e 列出正在執行的程序 ps f 列出程序的詳細資訊 ps uomc 列出 omc使用者的程序 ps l 顯示程序最詳細的資訊 ps l 顯示結果 f s uid pid ppid c pri ni addr sz wchan tty tim...