學習Hadoop部署集群環鏡 一

2021-06-18 22:40:42 字數 1329 閱讀 8950

1、首先需要了解hadoop部署架構圖,如下所示:

namenode:為部署的主節點,主要起主導作用,不會參與mapreduce任務。主要是管理從數字節點

datanode:為部署的從節點(數字節點),主要是參與mapreduce任務的執行。客戶端直接與主節點的守護程序進行通訊。

secondary namenode 次名字節點:用於監測和備份namenode,並輔助守護程序,像namenode一樣。與namenode通訊,根據集群配置的時間間隔獲取hdfs元資料的快照。如果namenode故障,可以從secondary namenode的快照可以減少停機的時間降低資料丟失的風險。

jobtracker(作業跟蹤節點):任務執行它是應用程式和hadoop之間的紐帶。管理,監控和分配任務執行。

tasktracker(任務跟蹤節點):datanode節點上的每個任務執行的執行程序。rn

2、檢查每台伺服器上有沒有安裝ssh。

由於集群上的每台機器間通訊都是通過ssh來進行通訊訪問。所以每台必須檢查是否安裝ssh

為了每台機器之間能夠相互通訊無障礙,所以無口令的ssh協議。ssh採用標準備的公鑰加密來成一對使用者驗收證金鑰,(乙個公鑰,乙個私鑰)。

公鑰被本地儲存在集群的每個節點上,私鑰則由主節點在試圖訪問遠端節點時傳送過來。結合這兩段資訊,目標機可以對這次登入嘗進行驗證。

每台節點上的賬號設定為相同的使用者級別。它僅於管理hadoop集群。如這裡我們將在每台機器上建立hadoop使用者

2.1驗證是否安裝:which ssh  回車,哪果有路徑說明已安裝

which sshd 回車,哪果有路徑說明已安裝

which  ssh-keygen 回車,哪果有路徑說明已安裝

如果沒有安裝,請參與linux相關資料進行安裝

2.2 在主節點上也就是namenode上安裝金鑰

ssh-keygen -t rsa 回車 提示資訊是產生公鑰/金鑰

檢視公鑰:

more /home/hadoop/.ssh/id_rsa.pub

2.3 將公鑰發布到每個集群機器

2.4登入到目標集群的機器上

mkdir ~/.ssh

chmod 700 ~/.ssh

mv ~/master_key ~/.ssh/authorized_keys

chmod 600 ~/.ssh/authorized_keys

2.5驗證是否安裝成功。登入到主節點上也就是namenode機器上

ssh 目標ip位址

如果出現last login :sun jan ***xx的資訊,就是最後登入的時間,不需要輸入密碼就可以轉到目標機器。

就說明ssh安裝成功了。基本環鏡已打通。

Hadoop集群Master節點部署方案

更改 etc hosts,新增所有集群機器ip到主機名對映 拷貝hadoop包hadoop.tar.gz到 usr local md5sum校驗hadoop.tar.gz包 md5sum hadoop.tar.gz 解壓hadoop.tar.gz包 tar xzf hadoop.tar.gz 更改h...

Hadoop集群部署模型縱覽1

vsphere big data extensions 簡稱bde 支援多種部署方式來構建hadoop集群。按 本文我們將著重介紹前2個部署模型,即儲存 計算繫結模型和單一計算模型。通常情況下,我們為了保證hadoop集群資料本地化 data locality 的需要,會將儲存 datanode 和...

Hadoop集群部署模型縱覽3

在前兩篇文章中,我們介紹了hadoop集群部署的3個方式,即 儲存 計算繫結和單一計算的hadoop集群 儲存 計算分離的hadoop集群部署 本文我們著重講解最後一種方式,即構建自定義的hadoop集群,作為對使用者更為開放的乙個部署選項。如下圖所示,如果不採用虛擬化技術進行整合,資金投入 cap...