最近有不少同事朋友問我,學習大資料應該學習哪些技能,我查閱相關資料,做了個大體彙總,方便感興趣的讀者閱讀。
flink
hadoop
mesos
spark mlib
tensorflow (google 系)
amazon machine learning
dmtk (微軟分布式機器學習工具)
hive
kylin
spark sql,
spark dataframe
impala
phoenix
elk
rocketmq
zeromq
activemq
rabbitmq
spark streaming
flume
python
rruby
spss
sas
d3.js
echarts
excle
時間序列
推薦系統
回歸分析
文字挖掘
決策樹支援向量機
貝葉斯分類
神經網路
spark mlib
tensorflow (google 系)
amazon machine learning
dmtk (微軟分布式機器學習工具)
raft
gossip
雜湊表二叉樹,紅黑樹,b樹圖
最大子陣列
最長公共子串行
最小生成樹
最短路徑
矩陣的儲存和運算
openstack
docker
大資料工程師 學習路徑
hadoop來自於谷歌mapreduce的程式設計模型包。mapreduce框架把應用程式分解為平行計算指令,跨大量節點執行非常大的資料集。典型例子是搜尋演算法。hadoop最初與網頁索引有關,迅速發展成為分析大資料的領先平台。如果你想成為大資料工程師,卻不知從何學起 找不到系統的課程和專案進行學習...
Linux運維工程師學習大綱
一 熟悉linux系統基本知識 1.linux基本概念 2.學習linux使用者管理和檔案結構部分 3.熟悉linux日誌檔案 4.熟練使用vi工具 5.了解cron job 6.了解swap交換區 7.了解系統啟動過程 二 linux的安裝與配置 1.安裝linux並合理規劃作業系統空間 2.服務...
演算法工程師學習流程
1.完成機器學習基礎的學習 機器學習方面的知識是演算法工程師區別於普通程式設計師的核心。這部分知識要重點掌握。1 學習資料 以林軒田的 機器學習基石 機器學習技巧 為主,以周志華的 機器學習 李航的 統計學習方法 為輔。2.練習 刷完 劍指offer 大概50題,最後可以手寫 並進行一些基本的邏輯訓...