大資料指無法用傳統資料庫軟體工具對其內容進行抓取、管理和處理的大體量資料集合。
海量資料處理指判斷資料的價值。
一、海量資料分成兩塊,一是系統建設技術,二,海量資料應用。
目前我了解大資料的職位:
大資料架構工程師
大資料演算法工程師(資料分析工程師,資料探勘工程師)
大資料運維工程師
二、系統建設技術
目前常用的hadoop生態圈技術,結構如圖:
涉及到應用型別,資料型別,安全性,機架伺服器數量,效能,運維,這個實驗性特別高。
一些應用上的演算法具體問題再詳細學習,專案驅動方式學習技術。
三、海量資料應用
演算法是資料的表現形式,必須兼具電腦科學基礎和統計基礎。
現在有乙個高大上的職業叫資料科學家,有人說資料科學家就是乙個比程式設計師更懂統計的統計學家,乙個比統計學家更會程式設計的程式設計師。覺得說得很形象。
基礎中的基礎:
線性代數,概率論
核心知識:
數理統計
**模型
機器學習
資料探勘方法,例如:線性回歸,邏輯回歸,決策樹分群,聚類、關聯分析、svm,貝葉斯,神經網路等;
學習大資料的方向
大資料領域的框架這麼多,hadoop,spark,flink等等,其實我們只要學明白其中乙個,上手同類的其他技術就不難了,舉一反三很重要。還有盡量學習主流經典的框架,比如hadoop太經典了,流處理的flink特別火。怎麼去學習乙個技術呢,這個學習思路也清晰 第一步 搞清楚這個技術是幹什麼,解決了什...
大資料學習後有哪些就業方向?
網際網路發展也正在從移動網際網路時代進入大資料時代。因此有很多人都想踏入大資料領域,體驗一把大資料的高階技術,但對於大資料學校半信半疑,不知道大資料學校到底怎麼樣?也不知道大資料學習後怎麼就業,有哪些方向?為了讓大家更好的了解,給大家介紹一下大資料就業六個方向。1 大資料系統研發工程師 這一專業人才...
大資料發展方向
最近面試了一家做大資料的公司,這也是自從打算從事計算機行業以來的第一家準備加入的公司。公司主要做大資料的分析,具體名字就不說了。閒著沒事,就簡單了解下大資料,發現現在對於大資料還沒有乙個統一的定義,看來新生的事物確實要多磨。問題來了 在獲得這些資料時,資料的創造者們,同意了嗎?關於個人隱私的問題這幾...