從jar包中提取預設配置
master node就是name node
master node會通過ssh將命令傳送到其他data node。
分離啟動secondarynamenode
配置檔案hdfs-site.xml,在node3上啟動secondarynamenode程序。
將hdfs-site.xml從master node傳送到其他所有data node。
重啟hadoop需要清理
stop-all.sh --config /path/to/hadoop_cluster
刪除所有節點的/tmp/hadoop-$user
刪除所有節點的$hadoop_home/logs
修改hadoop預設的本地目錄
core-site.xml
>
>
>
fs.defaultfsname
>
>
hdfs://node1/value
>
property
>
>
>
hadoop.tmp.dirname
>
>
/tmp/hadoop-$value
>
property
>
configuration
>
hdfs設計
適用於不適用於 塊
預設128m
檢視block的狀態
hadoop fsck /dir/or/file
配置檔案hdfs-site.xml(原始碼中為hdfs-default.xml)
>
>
dfs.blocksizename
>
>
134217728value
>
>
預設單位byte,
k(kilo),m(mega),g(giga),t(tera),p(peta),e(exa),
如:128k,30m,40g
且大小寫不敏感
description
>
property
>
向hdfs put檔案在namenode和datanode上都時可以的。
啟動的程序
# 在namenode節點上執行下述命令則效果是啟動所有節點的datanode程序
# 在datanode節點上執行下述命令則效果是只啟動該節點的datanode程序
hadoop-daemon.sh start datanode
#當然還可以如下使用來單獨啟動相應的程序
hadoop-daemon.sh start namenode
hadoop-daemon.sh start secondarynamenode
ubuntu設定靜態ip
# inte***ces(5) file used by ifup(8) and ifdown(8)
auto lo
iface lo inet loopback
# iface eth0 inet dhcp
iface eth0 inet static
address 192.168.74.128
netmask 255.255.255.0
gateway 192.168.74.2
dns-nameservers 192.168.74.2
auto eth0
$ sudo /etc/init.d/networking restart
虛擬機器靜態配置ip後將不向vmware傳送dhcp offer報文,但可以被本地訪問且可以上網。
ubuntu切換到字元介面
sudo vim /etc/default/grub
-------------------------------------
#grub_cmdline_linux_default="quiet splash"
grub_cmdline_linux_default=
"text"
grub_terminal=console
-------------------------------------
sudo update-grub
sudo
reboot
# 進入圖形介面
startx
獲得配置資訊
hdfs getconf -namenodes
hdfs getconf -secondarynamenodes
四大模組及配置檔案
hdfs檔案系統的操作命令
hdfs dfs <=
> hadoop fs
new old
Hadoop1 1 2學習筆記(3)
1.分布式檔案系統概念 隨著資料量越來越多,在乙個作業系統管轄的範圍存不下了,那麼就分配到更多的作業系統管理的磁碟中,但是不方便管理和維護,因此迫切需要一種系統來管理多台機器上的檔案,這就是分布式檔案管理系統。2.分布式檔案系統是一種允許檔案通過網路在多台主機上分享的檔案系統,可讓多機器上的多使用者...
hadoop學習筆記3 yarn
1.管理多種大資料框架spark hive等 使得不同框架之間資源共享,減少資源浪費 2.誕生原因 為了執行多種框架,比如想引入spark計算引擎,才導致了yarn的誕生 3.yarn縮寫 yet another resource negotiator 協作 使得 on yarn 如spark on...
Hadoop學習筆記 Hadoop初識
序言 資訊化發展到當今,網際網路的資料量是不斷地增加,那麼如何很好的處理以及利用這些資料可能是未來的乙個發展方向,這也之所以產生了各種平台的雲計算。對於網際網路而言,大資料量可分為兩種 第 一 大訪問量請求 第 二 大資料量處理。大訪問量請求這個事應用端應該思考的問題,如何很好的處理大的訪問量,如何...