hadoop安裝及其日誌

安裝方式：偽分布式，讓程序跑在一台機器上，只是埠不一樣

文件：此處上傳hadoop的tar包

說明：如果有多個機器，一行乙個

注意：只需要格式化一次即可

主節點：sbin/hadoop-daemon.sh

start namenode

從節點：sbin/hadoop-daemon.sh

start datanode

方式一：jps方式二：通過web ui檢視hdfs webui埠是50070

幫助命令;

bin/hdfs dfs

建立目錄

bin/hdfs dfs -mkdir -p /datas/tmp

上傳檔案：linux -》hdfs

bin/hdfs dfs -put /opt/datas/wordcount /datas/tmp/

列舉目錄檔案：

bin/hdfs dfs -ls /datas/

檢視檔案內容

bin/hdfs dfs -cat /datas/tmp/wordcount

刪除檔案

bin/hdfs dfs -rm -r -f /datas/tmp/wordcount

bin/hdfs dfs -

get /datas/tmp/wordcount /opt/modules/

對於分布式資源管理和任務排程框架來說

在yarn上面能夠執行很多種應用程式

並行資料處理框架

基於記憶體分布式計算框架

實時流式計算框架

分析資料，比mapreduce速度快

指定nodemanager執行在那些機器上,在配置hdfs的時候，已經配置了，

主節點

sbin/yarn-daemon.sh

start resourcemanager

從節點sbin/yarn-daemon.sh

程式執行在yarn，讀取hdfs上的資料進行處理

vi /datas/tmp/wordcount

hadoop框架給我們提供了測試程式

/opt/modules/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar

程式提交到yarn上執行只有一種方式：bin/yarn jar

bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /datas/tmp/wordcount /datas/mapreduce/output1

（1）主機名：8088

（2）hdfs 主機名： 50070

程序啟動不了，控制沒有報什麼錯誤，這個時候，我們只能通過檢視日誌的方式找到問題。

日誌檔案目錄：$/logs

檔名：主鍵模組的名稱-使用者名稱-服務名稱-主機名

hadoop 日誌引數

1 mapreduce執行日誌引數預設設定，訪問在hdfs上，重啟後將丟失，可通過mapred site.xml修改路徑設定分為歷史日誌引數和執行日誌引數 mapreduce.jobhistory.done dir mapreduce.jobhistory.intermediate done d...

Hadoop日誌介紹

1 hadoop日誌路徑 opt software hadoop 2.8.1 logs 2 日誌介紹 3 namenode報錯，如何查詢問題所在？1 定位到日誌 tail f hadoop root namenode hadoop001.log 2 開啟另外乙個會話，清空日誌檔案，cat dev n...

hadoop日誌聚合

一在yarn site.xml檔案中新增日誌監控支援該配置中新增下面的配置 5二在mapred site.xml檔案中新增日誌服務的配置該配置檔案中新增如下配置若是有了的話，無需再次新增 mapreduce.framework.name yarn mapreduce.jobhistroy....

hadoop安裝及其日誌

hadoop 日誌引數

Hadoop日誌介紹

hadoop日誌聚合

相關推薦