拜讀了《大資料時代》的第一部分,作者維克托·邁爾-捨恩伯格揭示了大資料所需的
三大思維變革:
1)分析事物相關資料,而不是取樣。也可以這麼認為,取樣=總體。
●大資料是指:不用隨機化分析法這樣的捷徑,而採用所有資料的方法。 ●
這裡所指的大資料是相對意義而不是絕對意義,不是指該資料量達到了多少多少
數量級,而是你是否對擁有全部的資料進行分析。
2)樂於接受資料的混亂性(包括錯誤資料),而不是追求精確性。
●大資料基礎上的簡單演算法也許會比小資料基礎上的複雜演算法來的更加有效。 ●
資料庫的改變:在關係型資料庫中,預先設定記錄結構不能滿足混亂的大資料記
錄,比如錯誤資料無法被儲存在資料庫中。需要非關係性資料庫來記錄這些錯誤點,並
且,非關係性在大資料處理能力上比關係型資料庫好,它不用非常精確地保證資料的有
效性和維護同一資料不同庫之間的同一性,因為這幾乎不會影響大資料分析的結果。
3)關注事物的相關關係,而不是因為關係。
●從大資料中分析得出事件a與事件b之間的關係就行了,而沒有必要知道兩者為什
麼會存在這種關係。 ●
相關關係是沒有絕對的,它表示的只是某種可能性。 ●
建立在相關關係分析法基礎上的**是大資料的核心。
大資料時代 生活 工作與思維的大變革
路邊的書攤上可以看到這本書的盜版,可見這本書還是很流行的。大資料時代 是國外大資料系統研究的先河之作,本書作者維克托 邁爾 捨恩伯格被譽為 大資料商業應用第一人 擁有在哈佛大學 牛津大學 耶魯大學和新加坡國立大學等多個網際網路研究重鎮任教的經歷,早在2010年就在 經濟學人 上發布了長達14頁對大資...
大資料時代 生活 工作與思維的大變革
路邊的書攤上可以看到這本書的盜版,可見這本書還是很流行的。大資料時代 是國外大資料系統研究的先河之作,本書作者維克托 邁爾 捨恩伯格被譽為 大資料商業應用第一人 擁有在哈佛大學 牛津大學 耶魯大學和新加坡國立大學等多個網際網路研究重鎮任教的經歷,早在2010年就在 經濟學人 上發布了長達14頁對大資...
大資料時代 生活 工作與思維的大變革(上)
最近在讀維克托.邁爾舍 恩伯格的大資料時代,以目前發展趨勢來看覺得是理所當然的事,但在當時寫這篇文章時,大資料還出入方興未艾之際,這種超前的思想具有顛覆性也不為過。雖然這本書不是很長,但傳達的思想覺得很有價值。之前有人說過在人工智慧的時代,雲計算好比發動機,大資料好比是燃料。大資料時代下,雲計算為我...