資料科學 什麼是資料科學?

2021-09-01 13:17:37 字數 607 閱讀 9593

資料是現實世界運轉留下的痕跡。

這些痕跡如何展示出來,則取決於我們採用什麼樣的資料收集和樣本採集方法。

將具象的資料轉化為抽象的資料,過程是絕對主觀的。

統計推斷

關注的是如何從隨機過程產生的資料中提取資訊。

關於建模

資料即資訊,不需要模型,了解相關性就夠了。–anderson

這是錯誤的想法。

什麼是模型

模型是乙個特殊的鏡片,透過這個鏡片觀察和了解現實世界的本質,而這個鏡片是什麼,不同學科的人,有不同的工具。

如何構建模型

如何知道什麼資料用什麼模型?

一半是藝術,一半是科學。

這沒有統一標準,如何選擇模型,選擇的理由是什麼,都是摸著石頭過河,加經驗總結。

但是eda(探索性資料分析)是乙個比較好的起步方法。通過eda繪製圖形,從資料中獲取直觀的感覺。對幫助解決問題有很大幫助。

從簡單處著手,先做起來,再做好。

end.

參考:《資料科學實戰》

什麼是資料科學?

我們已經聽到這個觀點 據哈爾 瓦里安 hal varian 說,統計學家是下乙個 的工作。五年前,在 什麼是web 2.0 裡蒂姆 奧萊利 tim o reilly 說 資料是下乙個因特爾在內 但是這句話到底是什麼意思?為什麼我們突然間開始關注統計學和資料?在這篇博文裡,我會檢視資料科學的各個方面,...

資料科學統計學 什麼是偏度?

作者 abhishek sharma 編譯 vk analytics vidhya 偏度的概念已融入我們的思維方式。當我們看到乙個影象時,我們的大腦會直觀地分辨出圖表中的模式。你可能已經知道,印度有超過50 的人口在25歲以下,65 以上的人口在35歲以下。如果你畫出印度人口年齡的分布圖,你會發現在...

資料清洗 資料科學

資料清洗 data cleansing 指刪除 更正資料庫中錯誤 不完整 格式有誤或多餘的資料。資料清洗不僅僅更正錯誤,同樣加強來自各個單獨資訊系統不同資料間的一致性。專門的資料清洗軟體能夠自動檢測資料檔案,更正錯誤資料,並用全企業一致的格式整合資料。wikipedia 資料清理的第一步是從資料集中...