我們已經聽到這個觀點:據哈爾•瓦里安(hal varian)說,統計學家是下乙個**的工作。五年前,在《什麼是web 2.0》裡蒂姆•奧萊利(tim o』reilly)說「資料是下乙個因特爾在內」。但是這句話到底是什麼意思?為什麼我們突然間開始關注統計學和資料?
在這篇博文裡,我會檢視資料科學的各個方面,技術、企業和獨特技能集合。
網際網路上充斥著「資料驅動的應用」。幾乎任何的電子商務應用都是資料驅動的應用。這裡面前端的頁面靠背後的資料庫來支援,它們兩者之間靠中介軟體來連線其他的資料庫和資料服務(信用卡公司、銀行等等)。但是僅僅使用資料並不是我們所說的真正的「資料科學」。乙個資料應用從資料裡獲取價值,同時創造更多的資料作為產出。它不只是帶有資料的乙個應用,它就是乙個資料產品。而資料科學則是能建立這樣的資料產品。
谷歌是創造資料產品的專家,這裡列幾個例子。
資料科學 什麼是資料科學?
資料是現實世界運轉留下的痕跡。這些痕跡如何展示出來,則取決於我們採用什麼樣的資料收集和樣本採集方法。將具象的資料轉化為抽象的資料,過程是絕對主觀的。統計推斷 關注的是如何從隨機過程產生的資料中提取資訊。關於建模資料即資訊,不需要模型,了解相關性就夠了。anderson 這是錯誤的想法。什麼是模型 模...
什麼是電腦科學
電腦科學研究的不是計算機本身,著名計算機科學家edsgar dijkstra曾經這樣比喻 計算機對於電腦科學就像望遠鏡對於天文學一樣。計算機是工具,不是研究的物件本身。由於計算機能夠實現我們所描述的任意功能,因此真正的問題是 我們可以描述什麼樣的功能?換言之根本的的問題在於計算機能計算出什麼?三種主...
資料科學統計學 什麼是偏度?
作者 abhishek sharma 編譯 vk analytics vidhya 偏度的概念已融入我們的思維方式。當我們看到乙個影象時,我們的大腦會直觀地分辨出圖表中的模式。你可能已經知道,印度有超過50 的人口在25歲以下,65 以上的人口在35歲以下。如果你畫出印度人口年齡的分布圖,你會發現在...