大資料 方法與技術

2021-09-30 15:40:10 字數 803 閱讀 2289

economist

的,一篇

mckinsey quarterly

的,和一篇

forbes

的。)其實這三篇都是空話。通篇無非就是在講(1)資料真的很大;(2)各行各業都要學會處理大資料。然而我真正關心的是「怎麼做」。於是 另一篇文章 進入視野。不過最精彩的還是麥肯錫的 分析報告 ,其中最吸引我的是「方法和技術」的部分。

說實話,這部分的內容(尤其是「應用」部分)有點超出我最初的想象。顯然大資料遠不止是bi。它實際上是 validated learning 的必要前提。大資料與敏捷、精益的結合將是必然的趨勢,為支援精益運營而做的bi不可能六個月才交付一次。

相關技術這部分,我把它細分為toolsconceptsfundamentals三個子類。這部分講的就是處理大資料所需的軟體技術。這部分的最大困擾在於:想學習這些技術比較難找到練手的場景。所以我還在豆瓣上標了幾本書,例如manning的這本 看起來應該是不錯的入門。

接下來的學習從兩個角度開始:理論基礎,和實踐。找一本合適的書,做乙個合適的例子,熟悉這個領域的資訊地圖和術語。

大資料分析技術與方法有哪些

大資料分析方法 1.視覺化分析 2.資料探勘演算法 3.性分析 4.語義引擎 5.資料質量和資料管理。大資料的技術 資料採集 etl工具負責將分布的 異構資料來源中的資料如關係資料 平面資料檔案等抽取到臨時中間層後進行清洗 轉換 整合,最後載入到資料倉儲或資料集市中,成為聯機分析處理 資料探勘的基礎...

虛擬化技術與大資料 新書推薦 大資料技術基礎

然而,面向大資料技術應該學什麼?如何學?以及學會怎樣用?是困擾眾多大資料初學者的主要問題。圍繞這些問題,我們以大資料相關概念及技術為主線,採用模組化方法對大資料及其相關的基本理論 關鍵技術和實際應用進行了綜合梳理,構建了大資料模組化知識體系 基於深入淺出思想及配套的實用 應用案例和操作實踐,融會貫通...

大資料技術與應用 Redis

1.基礎知識 redis是用c語言開發的乙個開源的高效能鍵值對 key value 資料庫。它通過提供多種鍵值資料型別來適應不同場景下的儲存需求,目前為止redis支援的鍵值資料型別如下字串 列表 lists 集合 sets 有序集合 sorts sets 雜湊表 hashs wget步驟如下 將r...