mapreduce的入門課程心得:
1.磁碟的讀寫速度成為瓶頸。光資料載入就會耗去大量時間。
2.產生的中間結果也必須放到外部儲存裝置上,磁碟讀寫的速度又一次耗時。
3.對中間結果的彙總需要將外部儲存的中間結果再一次讀入記憶體。
所以將檔案分散到大量機群中進行並行處理,能夠大大減少硬碟讀寫問題造成的影響。那麼mapreduce的乙個思路是就是
1. 將海量資料分散儲存
2. 每台機器對自己儲存資料進行加工和計算
3. 在選定額外的機器作為資料彙總點彙總結果。
所以mapreduce可以分為map和reduce兩個部分。map即為分散讀取資料進行處理,reduce可以理解為彙總結果,將結果輸出。
Spring入門學習 心得
可以通過如下途徑入門spring 1 看 spring 開發指南 夏昕v0.8預覽版 2 看 輕量級 j2ee 企業應用實戰 struts spring hibernate 整合開發 李剛所著 3 看 spring framework開發參考手冊 4 還可以看看spring 學習的中文論壇 http...
Hadoop入門學習心得
hadoop入門學習心得 網際網路的快速發展帶來了資料快速增加,海量資料的儲存已經不是一台機器所能處理的問題了。hadoop的技術就應運而生。在看了超人學院吳超老師的講解之後,對這個概念有了乙個比較系統的了解。可以講hadoop的核心內容看作是兩個部分,乙個是分布式儲存,乙個是分布式計算。對於分布式...
學習心得 python學習心得
自從來了深圳工作以後,尤其是屢屢面試碰壁以後。發現其實自己的知識面很窄,做筆試題的時候絞盡腦汁還是漏洞百出,並不是不會做,而是出現一大堆不該有的失誤。每次被問道,對資料庫了解嗎?說一大堆看起來很高階的東西 好啊,那我們寫幾個sql語句吧。馬上完蛋了,沒了手冊關鍵字都記不起。了解哪幾種指令碼語言,sh...