1. 大資料的職責和能力
1. 類似 資料分析師和資料探勘工程師 又有些不同。
2. 需要熟悉大資料各類sql外, hadoop, python或scala有一定掌握。
3. 工作內容: 資料採集、清洗和預處理
大資料平台上的資料倉儲的建設
離線資料統計指令碼的開發
實時資料處理作業開發
日常取數和分析
資料視覺化
還來資料探勘和建模
機器學習,深度學習模型開發
4 適合人群: 資料 統計學專業,計算機專業有紮實數學基礎的學員。
5. 運維,開發,想轉資料分析或資料探勘。
6. 大資料需要對資料庫的知識掌握很有必要,指令碼語言能力hivesql python,硬體、os、
網路、資料庫的基礎知識 hdfs hive基本命令,資料倉儲建模能力,資料、統計學、資料探勘、演算法能力。
7. 背景知識,注意積累。
hadoop簡介
1. 什麼是hadoop?
應用場景:海量資料儲存 日誌處理 資料分析 機器學習;
不適應場景: 少量結構化資料(少於tb), 低延遲資料訪問,大量小檔案, 實時計算
2. 版本選擇
3. 應用場景
4. 一些替代方案
大資料分析工程師入門 資料分析的價值
目前很多網際網路公司都有資料分析崗位,但是真正讓資料分析產生業務價值的公司少之又少。因此,本文結合作者自己多年資料分析的經驗和理解,來談談資料分析的價值,希望給從事資料分析工作或者對資料分析感興趣的讀者提供乙個思考資料分析價值的框架,更好地幫助大家利用好資料分析這個強有力的工具,最終讓資料分析產生業...
資料分析入門
2018年6月14日筆記 用適當的統計分析方法對收集來的大量資料進行分析,將他們加以彙總和理解並加以消化,以求最大化的開發資料功能,發揮資料的作用。資料分析可用於現狀分析,原因分析,分析。明確分析目的和思路 資料收集 資料處理 資料分析 資料展現 報告撰寫 明確分析目的之菜鳥與分析師對比 菜鳥想法....
大資料分析工具
新 指數 清博大資料 新 指數 www.gsdata.cn 是新 大資料第一平台,為運營新 利器 現已開通賬號分鐘級監測服務,打擊粉絲造假賬號,支援使用者自主監測新 資料 定製各類榜單,並提供資料api等各類增值服務。資料視覺化工具 cytoscape 圖表秀 資料觀 微博足跡視覺化 bdp個人版 ...