hadoop學習總結

2021-08-18 14:27:53 字數 413 閱讀 5073

1、sbin目錄:存放啟動或停止hadoop相關服務的指令碼

2、bin目錄:存放對hadoop相關服務(hdfs,yarn)進行操作的指令碼

3、etc目錄:hadoop的配置檔案目錄,存放hadoop的配置檔案

4、share目錄:存放hadoop的依賴jar包和文件,文件可以被刪除掉

5、lib目錄:存放hadoop的本地庫(對資料進行壓縮解壓縮功能)

驗證hdfs是否正常執行:

hadoop dfsadmin -report

檢視namenode狀態:hdfs haadmin -getservicestate nn1

hadoop-daemon.sh stop namenode

hadoop-daemon.sh start namenode

Hadoop學習總結

hadoop定義 hadoop元件 分布式檔案系統hdfs 維護hdfs檔案系統,是檔案系統的主節點,不儲存檔案資料 記錄了客戶端的操作日誌 edits 儲存了hdfs的最新狀態 edits檔案儲存了自最後一次檢查點之前的對hdfs的操作資訊,比如說新增檔案,儲存檔案,刪除目錄等資訊。儲存目錄為 t...

hadoop學習問題總結

1 找到問題的原因 sequencefile時連線不上錯誤,一直以為是集群沒有搭建成功,執行其他程式卻沒有問題,確定是程式本身的問題。2 hadoop streaming babel不能處理連續的兩個由sequencefile生成的檔案,一直不知道是什麼原因,將sequence用cat匯出時,又上網...

學習hadoop總結(1)

經過了痛苦的一段時間,現在終於發現了,自己原來也是可以走進大資料的殿堂的,不說別的,就拿命令列來說,個人是比較上心的,比如有一些命令總是忘記,就會一遍一遍的找到練習,然後再重複之前的操作,來來回回不下幾十次。總結如下 資料節點是檔案系統中真正儲存資料的地方。從元資料節點 secondary name...