(《學科前沿講座》課程報告,刪去抄襲和湊字數部分的支離破碎版本)
狄更斯在《雙城記》第一段裡這樣寫:這是最好的時代,這是最壞的時代;這是智慧型的時代,這是愚蠢的時代;這是信仰的時期,這是懷疑的時期;這是光明的季節,這是黑暗的季節;這是希望之春,這是失望之冬;人們面前有著各樣事物,人們面前一無所有;人們正在直登天堂;人們正在直下地獄。這用來形容我們現在所處的大資料時代再合適不過。面對龐大的資料,我們是享受當下資料給我們帶來的迅速便捷,還是懷念從前「車,馬,郵件都慢」的愜意生活;是自如地在資料海洋中。對於這些問題,本文以科幻**《銀河帝國》中以的「謝頓計畫」作引,分析大資料的歷史及定義,然後**它的意義從而推測未來的發展趨勢。
大資料是什麼
「謝頓計畫」
早在2023年,艾薩克阿西莫夫就在他的**《銀河帝國》中就描寫了乙個這樣的故事:在銀河帝國已有一萬二千年悠久歷史時,心理史學家謝頓卻注意到近百年來帝國在逐漸衰落,並做出驚人預言銀河帝國將會瓦解,整個銀河系注定化成一片廢墟,黑暗時期將持續整整三萬年。為了縮短整個星系**的時間(阻止帝國的瓦解已經無望),謝頓根據熱動力學中分子運動的狀態(單個分子滿隨機性而群體具有統計的熱力學上的可**性)衍生出了心理史學並利用其**並試圖改變歷史的走向。在我看來,謝頓理論其實是以大資料為基礎的。
大資料定義
首先,大資料要大,即規模大。其次,是多樣化。第三,動態化。《銀河帝國》中謝頓理論建立時社會已經達到高度文明狀態,所以,統計資料無論在時間還是空間上都足以支撐此計畫的實現。
大資料可以做什麼
在《銀河帝國》中,謝頓計畫最重要的意義當然在於改變未來以拯救人類。大資料在其中的作用是**,根據古往今來大量資料的統計規律來分析某事件發生的可能性。再通過改變當前可控的變數來達到想要的結果。
大資料不能做什麼
我們知道,大資料分析的是過去,現在和未來的相關因素,但現實是,隨時都可能有過去從未發生過的事件發生或新的想法產生,這使得大資料無法偵測到那些具有特異之處的東西。
謝頓計畫得以實施在於當時社會文明以達到後期,處於衰退階段,所以可以看作當前在發生的所有事情都是曾經發生過的。所以,謝頓可以通過資料分析從因推測果或者人工干預改變結果。然而謝頓計畫的失敗也在於不可控因素的加入,即騾的出現。騾是基因突變的產物,這個謝頓無法判斷到的誤差積累到遙遠的未來的時候就造成了巨大的歷史偏差,也差點讓謝頓計畫破產。
雖然目前受制於科學進步的程度和社會文明的發展,我們無法做到像《銀河帝國》那樣**並且改變未來,但是大資料依然表現出了強勁的潛力。與此同時我們也不應對大資料抱有盲目樂觀的幻想,畢竟目前為止大資料的發展還在初級階段。總之,用一句話來形容,前途是光明的,道路是曲折的。
從MS SQL刪除大資料說開去
對於資料庫中刪除資料,你說要注意什麼呢?怎樣寫?多數同學看到這兩個問題,想都不想就說,就乙個delete語句,注意刪除的條件不要刪除錯了就是,有什麼好注意的!是的,可以我再問一下,刪除動作是會寫日誌的,你放日誌的磁碟夠空間嗎?1.我先舉個實際的工作問題 2.整理t sql的刪除資料的語句和寫法 3....
四說大資料時代「神話」 從大資料到深資料 n
作為國內最大的電商平台之一,蘇寧每天要處理數量巨大的資料。為了更快速高效地處理這些資料,蘇寧排程平台採取了哪些措施呢?在機器學習領域一直有乙個基礎性的誤解,即更大的資料會產生更好的學習效果。然而,更大的資料並不一定意味著能發現更深刻的資訊。實際上,與資料的規模相比,資料的質量 價值和多樣性更值得關注...
四說大資料時代「神話」 從大資料到深資料 n
作為國內最大的電商平台之一,蘇寧每天要處理數量巨大的資料。為了更快速高效地處理這些資料,蘇寧排程平台採取了哪些措施呢?在機器學習領域一直有乙個基礎性的誤解,即更大的資料會產生更好的學習效果。然而,更大的資料並不一定意味著能發現更深刻的資訊。實際上,與資料的規模相比,資料的質量 價值和多樣性更值得關注...