1.大資料分析基礎 1%
2. python 基礎 5%
3. linux & ubuntu 作業系統基礎 2%
hadoop 安裝配置及執行機制解析 2%
hdfs 分布式檔案系統 2%
mapreduce 理論及實戰 2%
hadoop 生態其他常用元件 6%
資料庫導論 2%
mysql 理論及實戰 3%
hbase 安裝及使用 3%
hive 安裝及使用 5%
sqoop 安裝及使用 3%
資料探勘的基本思想 2%
資料探勘基本方法介紹 2%
有監督學習演算法 4%
無監督學習演算法 2%
spark 基礎理論 2%
b. spark rdd 基本概念及常用操作 3%
c. spark 流式計算框架 spark streaming、structured streaming 5%
d. spark 互動式資料查詢框架 spark sql 5%
e. spark 機器學習演算法庫 spark mllib 基本使用方法 15%
f. spark 圖計算框架 graphx 5%
a. 資料視覺化入門基礎 1%
b. python 資料視覺化入門 2%
c. python 高階資料視覺化方法 1%
a. 利用 hdfs shell 操作 hdfs 檔案系統 1%
b. 利用 hive sql 進行資料清洗 2%
c. 利用 sqoop 進行資料傳輸 1%
d. 利用 spark sql 進行資料讀取 2%
e. 利用 spark mllib 進行機器學習建模 8%
f. 利用 python 進行建模結果資料視覺化 1%
[1] jake vanderplas. python 資料科學手冊[m]. 人民郵電出版社,2018.(必讀)
[2] tom white. hadoop 權威指南(第三版)[m]. 清華大學出版社, 2015.(必讀)
[3] 王雨竹,高飛. mysql 入門經典[m]. 機械工業出版社,2013.(必讀)
[4] pang-ning tan 等. 資料探勘導論[m]. 人民郵電出版社,2011.(必讀)
[5] 林子雨等. spark 程式設計基礎[m]. 人民郵電出版社,2018.(必讀)
[6] hold karau 等. spark 快速大資料分析[m]. 人民郵電出版社,2015. (必讀)
[7] sandy ryza 等. spark 高階資料分析[m]. 人民郵電出版社,2015. (選讀)
大資料分析師養成記
以下是一位在資料分析領域打滾了n年後,寫下的一些體會,一定能給新人一些借鑑的地方。總結的不錯,大家可以借鑑學習哦 一 資料分析師有哪些要求?1 理論要求及對數字的敏感性,包括統計知識 市場研究 模型原理等。2 工具使用,包括挖掘工具 資料庫 常用辦公軟體 excel ppt word 腦圖 等。3 ...
大資料分析師「錢途」無量
大資料時代已經到來,人類開始進入商務智慧型化時代。如火如荼的大資料行業催生了一項與資料處理相關的職業 大資料分析師,後者通過對資料的挖掘分析來影響企業的商業決策。大資料分析師是幹嘛的?大資料分析師就是一群玩資料的人,玩出資料的商業價值,讓資料變成生產力。阿里巴巴集團研究員薛貴榮曾如此概述。大資料分析...
大資料分析師的卓越之道
大資料時代的資料分析區別於普通的資料分析,這是由大資料的特性所決定的,為了適應大資料的時代的發展,資料分析師也應該轉變一些分析的思想和觀念。大資料時代的要求 資料需要流動起來才有價值 大資料典型的場景 當資料量 基礎設施以及資料價值逐漸變大時,對知識挖掘和發現的方法也需要不斷的改進。在量子論的世界裡...