hadoop 2.x 生態系統組成
hadoop 組成
namenode
元資料伺服器,屬於管理層,用於管理資料的儲存,主節點,儲存檔案的元資料,如檔名,檔案目錄結構,檔案屬性,生成時間,副本數,檔案許可權)及每個檔案的塊列表及塊所在datanode等。
secondary namenode 輔助元資料伺服器
jobtracker
任務排程員,管理層程式,管理集群資源並對任務進行資源排程,監控任務執行,負責使用者提交的作業,負責啟動,跟蹤任務的執行。
datanodes
塊儲存 屬於應用層,使用者資料儲存在datanodes ,被namenode 管理,定時向namenode匯報工作情況,執行namenode 分配分發的任務,儲存檔案塊資料及塊資料的校驗和。
tasktrackers
任務執行,應用層程式,執行jobtracker分發的任務,並想jobtracker 匯報工作情況,管理各個任務在每個節點的執**況。
mapreduce 分布式離線計算框架
yarn 集群資源管理系統
hdfs 分布式檔案系統
hadoop 部署模式
單機模式 standalone
偽分布式模式 pseudo-distriubuted
一台機器上執行所有的hadoop 服務(五個守護程序)
全分布式模式 fully distributed
知識點回顧
回顧 簡介 python 安裝 python3.8.5 why?python解釋型語言,安裝python3 直譯器 lib pip命令 pip list pip install x pip uninstall 解除安裝 pip install 版本號 pip freeze requiremente....
知識點回顧
方法 變數作用域 方法過載 ref 引用傳參,側重於在方法中一定要修改引數,傳入方法前必須賦值 out 側重於輸出,方法返回前 引數使用前 必須賦值 params 可變引數,只能修飾陣列型別,只能在方法列表的最後.如果沒有給可變引數賦值,那麼可變引數會自動初始化長度為0.方法遞迴 迴圈 方法自己呼叫...
c 知識點回顧
過載只與函式的引數有關,而與函式的返回型別無關 int 形參 實參 0 char short int double 形參 實參 float double 用省略號 表示,即函式可以有任意個任意型別的引數。如,int printf const char format,在乙個函式中,可指定多個 甚至全部...