內容:
假設乙個年級有兩個班級,資料分別在class1.csv和class2.csv中,求該年級的數學成績平均值。資料第一列為學號,第二列為數學成績。 要求,必須使用combiner類,且最後輸出一行資料,該行僅有乙個平均值。
public
class
}
2、reduce
public
class
myreducer extends reducer
context.
write
(nullwritable.
get(),
newfloatwritable
(total/count));
}}
3、driver
public
class
mydriver
; path[
] inpaths=
new path[puts.length]
;for
(int i=
0;i)//指定job的輸入原始檔案所在目錄
// todo: specify input and output directories (not files)
fileinputformat.
setinputpaths
(job, inpaths)
; fileoutputformat.
setoutputpath
(job, outpath);
boolean result=job.
waitforcompletion
(true);
system.
exit
(result?0:
1);}
}
4、結果 大資料核心技術解讀
網際網路時代,我們每天都在生產著大量的資料,並且這些資料被記錄儲存下來,不斷地累積,資料規模越來越大,想要實現對資料的處理,就需要成熟的大資料技術框架來提供支援。今天的大資料前沿技術培訓分享,我們就來對大資料核心技術做乙個簡單的入門介紹。在大資料當中,相當一部分的資料是半結構化 非結構化的,並且伴隨...
大資料的核心技術(一)
我們在之前的文章中提到過,大資料的核心技術就是機器學習 資料探勘 人工智慧以及其它大資料處理基礎技術。在這篇文章中我們給大家詳細地介紹一下這些內容,希望這篇文章能能夠給大家帶來幫助。首先說一下機器學習,一般資料分析師都知道,機器學習是大資料處理承上啟下的關鍵技術,機器學習往上是深度學習 人工智慧,機...
Docker 核心技術之映象
映象是乙個docker的可執行檔案,其中包括執行應用程式所需的所有 內容 依賴庫 環境變數和配置檔案等。通過映象可以建立乙個或多個容器。作用 命令格式 命令引數 options 只搜尋官方的 centos docker search f is official true centos作用 命令格式 ...