資料探勘需要什麼數學基礎(二)

2021-09-09 06:58:30 字數 791 閱讀 5368

首先給大家介紹的就是微積分的知識,資料探勘工作需要微積分,在資料探勘工作中,微積分只是數學分析體系的基礎。其基礎性作用不言而喻。機器學習研究的大部分問題是在連續的度量空間進行的,無論代數還是統計,在研究優化問題的時候,對乙個對映的微分或者梯度的分析總是不可避免。掌握了微積分的知識是資料探勘工作最基礎的能力要求。

然後就要給大家說的是拓撲學的知識了,大家都知道,這是學術中很基礎的學科。它一般不直接提供方法,但是它的很多概念和定理是其它數學分支的基石。看很多別的數學的時候,會經常接觸這樣一些概念:開集,閉集,連續函式度量空間,柯西序列,鄰接性,連續性。很多的內容都是我們在大學中學習過的,當時是基於極限的概念獲得的。但是看過拓撲學之後,對這些概念的認識會有根本性的拓展。在計算機領域中,拓撲學和計算機領域中有很大的聯絡。

接著給大家說一下測度理論,測度理論就是和實分析關係非常密切的學科。可以這麼說,概率本身就是一種測度。測度理論對於機器學習的意義是根本的,現代統計學整個就是建立在測度理論的基礎之上。在一些統計方面的文章中它們會把統計的公式改用測度來表達,這樣做有兩個好處:所有的推導和結論不用分別給連續分布和離散分布各自寫一遍了,這兩種東西都可以用同一的測度形式表達:離散分布的求和基於計數測度,而且還能推廣到那種既不連續又不離散的分布中去。而且,即使是連續積分,如果不是在歐氏空間進行,而是在更一般的拓撲空間。所以說,測度理論給資料探勘中帶來了十分方便的應用,這就是為什麼資料探勘要引入測度理論的原因。

資料探勘中需要的內容是非常廣泛而深厚的,我們在這篇文章中給大家介紹了部分的資料基礎學科,這些知識看似有些枯燥實則都是需要我們打好基礎掌握的知識,由於篇幅原因我們就給大家介紹到這裡了,最後祝願大家早日學成資料探勘師。

資料探勘需要什麼數學基礎(二)

首先給大家介紹的就是微積分的知識,資料探勘工作需要微積分,在資料探勘工作中,微積分只是數學分析體系的基礎。其基礎性作用不言而喻。機器學習研究的大部分問題是在連續的度量空間進行的,無論代數還是統計,在研究優化問題的時候,對乙個對映的微分或者梯度的分析總是不可避免。掌握了微積分的知識是資料探勘工作最基礎...

python資料分析需要什麼基礎

python資料分析需要什麼基礎?1.sql 資料庫 我們都知道資料分析師每天都會處理海量的資料,這些資料 於資料庫,那麼怎麼從資料庫取資料?如何建立兩表 三表之間的關係?怎麼取到自己想要的特定的資料?等等這些資料選擇問題就是你首要考慮的問題,而這些問題都是通過sql解決的,所以sql是資料分析的最...

我們需要什麼資料架構?

我們需要什麼資料架構?在大資料和資料科學的新時代,對於企業而言,具有與業務流程一致的集中式資料體系結構至關重要,該體系結構隨業務增長而擴充套件,並隨技術進步而發展。成功的資料架構可以使資料的各個方面清晰明了,從而使資料科學家能夠高效地處理可信賴的資料並解決複雜的業務問題。它還使組織做好準備,以利用新...