編寫python指令碼「rackaware.py」 並拷貝到其他節點的對應路徑下
#!/usr/bin/python
#-*-coding:utf-8 -*-
import sys
rack =
if __name__==
"__main__"
: print "/" + rack.get(sys.ar**[1],"db19_sw001"
)
命令驗證
編輯core-site.xml配置檔案,新增這個**,並拷貝到其他節點的對應路徑下
如下圖
core-site.xml 這個配置檔案裡的路徑不對或多加了空格等
檢視程序 jps 集群有些沒有啟動成功
rackaware.py 的許可權不夠 chmod 777 rackaware.py
rackaware.py 或 core-site.xml 在其他節點沒拷貝成功
hadoop集群配置機架感知
自己搭建的hadoop集群一般預設不具備機架感知能力,為了提高hadoop集群的網路效能,我們常常需要配置機架感知。下面是以下步驟 一 修改配置檔案core site.xml,新增配置屬性 topology.script.file.name home r203 hadoop 0.20.2 racka...
hadoop配置機架感知,原理
hadoop權威指南 裡面有說明,配置機架感知的目的就是要最大程度發揮hadoop的效能,要做到這點就是知道hadoop集群的網路拓撲結構 it knows the topology of your network 如果集群中的機器都跑在乙個機架上,那麼我們什麼都不用做,集群下的節點預設都是在 de...
Hadoop配置機架感知 python指令碼
昨天qq群裡提了乙個hadoop執行效率分配的問題,總結一下,寫個文章。集群使用hadoop 1.0.3 有些hadoop集群在執行的時候,不完全是絕對平均的分配,不過需要盡可能平均的分配任務,避免某一台或者某幾台伺服器任務過重,其他伺服器無事可做。這個,一方面是需要用到balancer,乙個就是機...