一. mapreduce
mapreduce是一種用於資料處理的程式設計模型。
mapreduce本質是並行的,因此可在在乙個擁有足夠多機器的環境下完成大規模資料分析任務.即mapreduce的優勢在於處理大型資料集。
**:見附件1
單一reduce資料流圖
二. hadoop分布式檔案系統
三. hadoop的i/o
四. hadoop的應用
五. mapreduce工作原理
六. mapreduce的型別與格式
七. mapreduce特性
八. hadoop集群安裝
九. hadoop管理
Hadoop學習筆記 Hadoop初識
序言 資訊化發展到當今,網際網路的資料量是不斷地增加,那麼如何很好的處理以及利用這些資料可能是未來的乙個發展方向,這也之所以產生了各種平台的雲計算。對於網際網路而言,大資料量可分為兩種 第 一 大訪問量請求 第 二 大資料量處理。大訪問量請求這個事應用端應該思考的問題,如何很好的處理大的訪問量,如何...
Hadoop學習筆記
hadoop介紹 hadoop是google雲計算框架的開源實現,是乙個分布式儲存和分布式計算的框架,主要包括hdfs和mapreduce的實現。hdfs hdfs由乙個namenode和多個datanode組成,其中namenode相當於系統的元資料存放地,它是hadoop系統的神經中樞,而多個d...
Hadoop學習筆記
fsimage 記憶體元資料 editlog 效率 安全監測節點錯誤 datanode向namanode定時返回心跳 監測網路錯誤 資料傳送後返回ack 監測儲存錯誤 傳輸資料損壞,通過資料的checksum監測 硬碟儲存資料損壞,通過每個block的checksum監測 partition 將ma...