1. 5個v
(1) volume 高容量
(2)velocity 高速度
(3)variety 多樣性
(4)veracity 真實性
(5)value 價值性
2. 工作
(1)儲存
(2)管理
(3)分析 (這裡主要講這個)
3.大資料分析
通過對大量資料進行分析,挖掘發現其中的模式和模型。
(1)valid:對新資料有效
(2)useful:能在一定程度上方便對item進行決策
(3)unexpected:模式/模型不易被觀察到
(4)understandable:人們能夠對模式進行解釋
4.資料分析任務
(1)描述方法
找到人類可解釋的模式來描述資料,如:聚類
(2)**方法
使用一些已知變數來**未知的變數,如:推薦系統
大資料處理技術之資料整合
大資料處理技術是乙個十分重要的工作,就好比做菜,我們做菜之前就需要對蔬菜進行清洗,洗過的菜我們才能夠吃的放心,同時還有助於我們的身體健康。而大資料處理就好比清洗蔬菜一樣,當我們對資料整理以後,我們才能夠分析出乙個準確的結果。而大資料處理的技術有很多,其中最常見的就是資料整合,那麼什麼是資料整合呢?下...
大資料處理
大資料處理的流程主要包括以下四個環節 採集 匯入 預處理 統計 分析 挖掘,下面針對這四環節進行簡單闡述。大資料處理之一 採集 在大資料的採集過程中,其主要特點和挑戰是併發數高,因為同時有可能會有成千上萬的使用者來進行訪問和操作,比如火車票售票 和 它們併發的訪問量在峰值時達到上百萬,所以需要在採集...
大資料處理技術之冗餘消除
我們在分析資料的時候,需要對資料進行整理,這樣就能夠方便資料分析工作。當然,資料加工是資料分析工作之前的工作,而在大資料處理中有很多資料整理的技術,其中最常見的就是冗餘消除,那麼什麼是資料冗餘呢?在這篇文章中我們就詳細地給大家解答一下這個問題。而對於普通的資料傳輸和儲存,這就涉及到了乙個技術,那就是...