1.hdfs 偽分布式哪三個程序,簡寫 nn dn snn
2.yarn偽分布式哪兩個程序,簡寫 rm nm
3.簡述 nn做什麼的? 管理檔案系統的命名空間,維護檔案系統的目錄樹的,定期接受來自dn的blockmap
4.簡述 snn是做什麼的那幅圖,是否能夠描述清楚? 定期來去nn上的fsimage和editlog合併成新的fsimage.ckpt並返滬給nn
5.乙個檔案130m,block設為128m,系統設定3副本,請問多少塊,多少儲存 6個block,儲存390m
6.拓展題: 所以,假如都是5m 10m 20m這些小檔案,我們是不是為了避免nn節點記憶體的壓力,要不合併這些小檔案,要不就將冷資料遷移到比如oss,s3儲存上 是的,nn上不適合儲存大量的小檔案,無論小檔案還是大檔案都將占用相同的nn資源,小檔案太多了會對nn造成很大的壓力
7.假如讓你找配置引數,你會在官網找嗎 區分是***-env.sh檔案中配置的還是在xml檔案中配置的,然後再去官網中的doc中查詢
8.簡述你們對shuffle的理解 通俗一點解釋叫洗牌,不同節點上的資料進行重新分配
9.簡述什麼是資料本地化 dn和nm部署在同乙個節點上,是的計算和資料儲存不同的網路io來傳輸
11.hive資料分為 元資料和資料,那麼你們課程中,分別儲存在** mysql hdfs,hive上的元資料一般儲存在關係型資料庫當中
每天彙總 9 10
1,檢視當前目錄是什麼命令?pwd 2,切換目錄的命令是什麼?cd 3,切換到家目錄有那哪些命令?cd cd home username cd 4,切換到上一次和上一層的命令分別是什麼?cd cd 5,絕對路徑與相對路徑的區別是什麼?絕對路徑都是從根目錄開始的,而相對路徑是從當前目錄開始的 6,檢視...
每天彙總 9 11
1,臨時獲取root許可權是修改那個配置檔案?新增一行什麼?命令是?etc sudoers username all all all sudo commend1 2,sudo和su能不能一起使用?能 3,安裝rpm包的命令是什麼?yum install 4,解除安裝rpm包命令是什麼?yum rem...
每天彙總 10 19
1.當前目錄命令是什麼 pwd 2.什麼是叫絕對路徑 什麼是相對路徑 絕對路徑是從根目錄下開始的,而相對路徑是從當前目錄開始的 3.切換目錄,那麼切換到上一次和上一層目錄命令是什麼 cd cd 4.資料夾建立命令和及聯建立的命令引數 mkdir mkdir p 5.說說你們認為建立檔案的 哪些命令 ...