1.hadoop一般廣義和狹義分別指什麼
hadoop生態圈,hadoop軟體
2.hadoop軟體哪三個組成
hdfs yarn mapreduce
3.hdfs偽分布式的程序簡寫分別是什麼?
nn,dn,snn
4.yarn偽分布的程序簡寫分別是什麼?
nm,rm
5.nn節點是幹什麼的
記錄資料節點,維護目錄,接受dn的心跳資訊
6.dn是幹什麼的
儲存資料
7.簡述副本放置策略
就近原則
8.簡述 snn是幹什麼的
合併editlog和fsimage
9.簡述hdfs讀寫流程
讀:客戶端傳送請求到nn,獲取塊資訊給客戶端呼叫read讀取最近的塊資訊
10.塊128m,三個副本,乙個檔案260m,多少塊,多少實際儲存
9個塊,實際使用260*3
11.為什麼為什麼hdfs不適合儲存小檔案
因為小檔案太多會讓nn節點壓力過大,檔案讀取速度變慢
12.hadoop fs命令等價什麼命令
hdfs dfs
put get
14.如果讓你們檢視hdfs dfs命令幫助,會不會
hdfs dfs --help
15.談談你們對shuffle的理解
洗牌,將所有key值相同的放在一起
16.mapreduce分為哪兩個階段
map和reduce
17.簡述mr job提交yarn的工作流程
申請資源,提交map作業,進行reduse作業,
18.hdfsyarn預設埠web的,分別多少
50070 8088
19.假如讓你們去官網找配置
hadoop.apach.org官網的文件查詢配置檔案說明
20.什麼叫容器container
emmm簡單說就是動態資源分配
每天10分鐘 10 26
1.我們學習的是sqoop1 那麼匯入匯出,是mysql到hive,是匯出嗎 匯入2.sqoop匯入到hive,能夠根據寫sql來導嗎 可以3.hive內部表和外部表什麼區別 內部表刪除的時候元資料和hdfs路徑也將被刪除,外部表只刪除元資料hdfs保留4.什麼是分割槽表 乙個表按照字段分割槽的表,...
每天10分鐘 10 19
1.當前目錄命令是什麼 pwd2.什麼是叫絕對路徑 什麼是相對路徑 絕對路徑是從根目錄下開始的,而相對路徑是從當前目錄開始的3.切換目錄,那麼切換到上一次和上一層目錄命令是什麼 cd cd 4.資料夾建立命令和及聯建立的命令引數 mkdir mkdir p5.說說你們認為建立檔案的 哪些命令 vi ...
每天10分鐘 10 23
1.tar解壓和壓縮 引數是什麼 tar xzvf tar czvf2.tar解壓後,我們要習慣注意什麼 檢視使用者使用者組3.如何配置乙個普通使用者為sudo許可權的無密碼的 在 etc sudoers文件中新增username all root nopasswd all4.su jepson 你...