今天晚上我要看大資料時代這一部巨作,我決定用這篇文章來記錄裡面挑逗我神經的話語。
1.大資料洞察:社會需要放棄它對因果關係的渴求,而僅需關注相關關係。也就是說只需要知道是什麼,而不需要知道為什麼。這就推翻了自古以來的慣例,而我們做決定和理解現實的最基本方式也將受到挑戰。
2 如今,資料已經成為了一種商業資本,一項重要的經濟投入,可以創造新的經濟利益。事實上,一旦思維轉變過來,資料就能被巧妙地用來激發新產品和新型服務。資料的奧妙只為謙遜、願意聆聽且掌握了聆聽手段的人所知。
3.真正的革命並不在於分析資料的機器,而在於資料本身和我們如何運用資料。
4. 人類儲存資訊量的增長速度比世界經濟的增長速度快
4倍,而計算機資料處理能力的增長速度則比世界經濟的增長速度快
9倍。
5.這些**系統之所以能夠成功,關鍵在於它們是建立在海量資料的基礎之上的。此外,隨著系統接收到的資料越來越多,它們可以聰明到自動搜尋最好的訊號和模式,並自己改善自己。
系統可以通過一種
「反饋學習
」的機制,利用自己產生的資料判斷自身演算法和引數選擇的有效性,並實時進行調整,持續改進自身的表現
6.資料化意味著我們要從一切太陽底下的事物中汲取資訊,甚至包括很多我們以前認為和「資訊
」根本搭不上邊的事情。比方說,乙個人所在的位置、引擎的振動、橋梁的承重等。我們要通過量化的方法把這些內容轉化為資料。這就使得我們可以嘗試許多以前無法做到的事情,如根據引擎的散熱和振動來**引擎是否會出現故障。這樣,我們就激發出了這些資料此前未被挖掘的潛在價值。
7. 們大部分的習俗和慣例都建立在乙個預設好的立場上,那就是我們用來進行決策的資訊必須是少量、精確並且至關重要的。但是,當資料量變大、資料處理速度加快,而且資料變得不那麼精確時,之前的那些預設立場就不復存在了。此外,因為資料量極為龐大,最後做出決策的將是機器而不是人類自己。
8.大資料的精髓在於我們分析資訊時的三個轉變 :
在大資料時代,我們可以分析更多的資料,有時候甚至可以處理和某個特別現象相關的所有資料,而不再依賴於隨機取樣。
a. b.研究資料如此之多,以至於我們不再熱衷於追求精確度。
大資料紛繁多樣,優劣摻雜,分布在全球多個伺服器上。擁有了大資料,我們不再需要對乙個現象刨根究底,只要掌握大體的發展方向即可。當然,我們也不是完全放棄了精確度,只是不再沉迷於此。適當忽略微觀層面上的精確度會讓我們在巨集觀層面擁有更好的洞察力。
c.我們不再熱衷於尋找因果關係 。
大資料告訴我們
「是什麼
」而不是
「為什麼」。
9. 對我們而言,危險不再是隱私的洩露,而是被預知的可能性
——這些能**我們可能生病、拖欠還款和犯罪的演算法會讓我們無法購買保險、無法貸款、甚至在實施犯罪前就被預先逮捕。
10.
大資料標誌著人類在尋求量化和認識世界的道路上前進了一大步。過去不可計量、儲存、分析和共享的很多東西都被資料化了。擁有大量的資料和更多不那麼精確的資料為我們理解世界開啟了一扇新的大門。社會因此放棄了尋找因果關係的傳統偏好,開始挖掘相關關係的好處。
我開發的基本觀點
1.作為架構,抽像是重要的,但是技術實現更重要,必竟有些效能問題不是光加機器可以解決的.比如松耦合,用佇列最好,但佇列需要資料庫監聽,分布式大量的資料傳輸,大量的序列化和反序列化都是效能瓶頸,非同步需要大量的日誌讀寫,多執行緒自身的損耗,負載勻衡自身的損耗,以訊息機制還會導致資料庫讀寫成倍的增長,而...
大資料時代
大資料 巨量資料 big data 指的是需要新處理模式才能具有更強的決策力,洞察力和流程優化能力的海量 高增長率和多樣化的資訊資產。4v特點 volume 大量 velocity 高速 variety 多樣 value 價值 資料倉儲,英文名稱為data warehouse,可簡寫為dw或dwh。...
大資料時代
不斷的從 發現這個很具廣告特色的語句,他們總是鼓吹大資料時代的來臨,好像如果你沒抓住他,你就要立馬落後別人好幾條馬路。各種公司企業對他們的產品也宣稱產品是大資料時代不可或缺的科技 乙個錢學森相當於10個王牌師。國內到處充斥著浮躁,不管是大學還是業界,大家都想賺點錢一夜暴富然後過上高富帥的生活。大資料...