大資料核心技術之MapReduce基礎程式設計(實驗)

2021-10-05 20:32:17 字數 962 閱讀 7255

內容:

假設乙個年級有兩個班級,資料分別在class1.csv和class2.csv中,求該年級的數學成績平均值。資料第一列為學號,第二列為數學成績。 要求,必須使用combiner類,且最後輸出一行資料,該行僅有乙個平均值。

public

class

}

2、reduce

public

class

myreducer extends reducer

context.

write

(nullwritable.

get(),

newfloatwritable

(total/count));

}}

3、driver

public

class

mydriver

; path[

] inpaths=

new path[puts.length]

;for

(int i=

0;i)//指定job的輸入原始檔案所在目錄

// todo: specify input and output directories (not files)

fileinputformat.

setinputpaths

(job, inpaths)

; fileoutputformat.

setoutputpath

(job, outpath);

boolean result=job.

waitforcompletion

(true);

system.

exit

(result?0:

1);}

}

4、結果

大資料核心技術解讀

網際網路時代,我們每天都在生產著大量的資料,並且這些資料被記錄儲存下來,不斷地累積,資料規模越來越大,想要實現對資料的處理,就需要成熟的大資料技術框架來提供支援。今天的大資料前沿技術培訓分享,我們就來對大資料核心技術做乙個簡單的入門介紹。在大資料當中,相當一部分的資料是半結構化 非結構化的,並且伴隨...

大資料的核心技術(一)

我們在之前的文章中提到過,大資料的核心技術就是機器學習 資料探勘 人工智慧以及其它大資料處理基礎技術。在這篇文章中我們給大家詳細地介紹一下這些內容,希望這篇文章能能夠給大家帶來幫助。首先說一下機器學習,一般資料分析師都知道,機器學習是大資料處理承上啟下的關鍵技術,機器學習往上是深度學習 人工智慧,機...

Docker 核心技術之映象

映象是乙個docker的可執行檔案,其中包括執行應用程式所需的所有 內容 依賴庫 環境變數和配置檔案等。通過映象可以建立乙個或多個容器。作用 命令格式 命令引數 options 只搜尋官方的 centos docker search f is official true centos作用 命令格式 ...