前幾篇文章中我們都是從統計學的角度給大家講解資料探勘和統計學的區別所在,但是對於統計學來說,資料探勘中的核心就是準則,資料探勘意味著資料集的規模,它常常標示著傳統的準則不可用,我們在這篇文章中給大家詳細地介紹一下這些內容。
相對於統計學而言,資料探勘中準則起著更為核心的作用,資料探勘所繼承的學科如電腦科學及相關學科也是如此。資料集的規模常常意味著傳統的統計學準則不適合資料探勘問題,不得不重新設計。部分地,當資料點被逐一應用以更新估計量,適應性和連續性的準則常常是必須的。儘管一些統計學的準則已經得到發展,但更多的應用是機器學習。
在很多情況下,資料探勘的本質是很偶然的發現非預期但很有價值的資訊。這說明資料探勘過程本質上是實驗性的。這和確定性的分析是不同的。實際上,乙個人是不能完全確定乙個理論的,只能提供證據和不確定的證據。確定性分析著眼於最適合的模型建立乙個推薦模型,這個模型也許不能很好的解釋觀測到的資料。很多,或許是大部分統計分析提出的是確定性的分析。然而,實驗性的資料分析對於統計學並不是乙個新生事務,或許這是統計學家應該考慮作為統計學的另乙個基礎,而這已經是資料探勘的基礎。所有這些都是正確的,但事實上,資料探勘所遇到的資料集按統計標準來看都是巨大的。在這種情況下,如果使用統計工具可能會得出乙個不準確的結果,這是因為百萬個偶然因素可能就會使其失效。
而且,如果資料探勘的主要目的是發現,那資料探勘就不關心統計學領域中的在回答乙個特定的問題之前,如何很好的蒐集資料,例如實驗設計和調查設計。資料探勘本質上假想資料已經被蒐集好,關注的只是如何發現其中的秘密。這些秘密往往就是資料分析工作中要找到的規律。
在這篇文章中我們給大家介紹了資料探勘和統計學中的不同點,資料探勘中的準則起著核心的作用,而統計學不是這樣的。當然,資料探勘的本質就是發現非預期但很有價值的資訊,懂得了這些才能夠發現資料探勘工作的意義。
聊一聊統計學和資料探勘的區別(六)
在上面的文章中我們在資料探勘的性質方面給大家介紹了資料探勘和統計學的知識。在統計學中,統計學很少去關注實時分析,而資料探勘中需要注意這些事情,這也是資料探勘與統計學的區別之一,現在我們繼續給大家介紹一下資料探勘知識與統計學的區別。在統計學中,有很多的問題發生在總體隨時間變化的情形。因此,我們已經論述...
聊一聊統計學和資料探勘的區別(七)
在統計學和資料探勘中,有很多東西都是容易混淆的,比如他們的目的都是一樣的,但是統計學主要關注的是定量資料,而資料探勘中需要處理其他形式的資料,這些也是資料探勘與統計學中需要注意的事情。統計學和資料探勘區別還有哪些呢?當邏輯資料越來越多的時候,比如當要發現的模式由連線的和分離的要素組成的時候。類似的,...
聊一聊統計學與資料探勘的區別(一)
當大家看到這個題目的時候,想必大家都有些疑惑 統計學和資料探勘看起來並不容易混淆的東西,有必要去區分統計學和資料探勘嗎?答案是肯定的,這是因為統計學和資料探勘有共同的目標,就是發現資料中的結構,下面我們就給大家講述一下統計學與資料探勘的區別。我們說過了,統計學和資料探勘有著共同的目標就是發現資料中的...