概率統計在機器學習中的作用

2021-10-04 17:08:37 字數 996 閱讀 2391

在進行機器學習的時候,我們會接觸到很多的數學知識,而這些數學知識有很多,比如說線性代數和概率統計。如果線性代數可以看成是數量還有結構的組合的話,那麼概率統計就可以看成是模型還有資料的組合。那麼大家是否知道概率統計在機器學習中的作用是什麼呢?下面我們就給大家解答一下這個問題。

其實在機器學習中,模型和資料組合在一塊是雙向的處理。我們機器學習有學習的階段,我們要利用這個資料去訓練這個模型,這個階段,我們是用資料去學習這個模型。在模型裡面,我們就可以去選擇。有那麼多的模型,像我們剛才說到的,有k-近鄰的模型,有回歸模型,有決策樹,還有支援向量機,這樣不同的模型。我們訓練的任務就是用資料來學習這些模型,來確定這個模型的引數,最終得到乙個確定的模型。這就可以看成什麼呢?看成是在給定資料的情況下,我們來求解這個引數,它的條件概率。給定的資料,如果有一部分引數的條件概率是最大的,那麼就選擇這部分引數,作為我們這個模型的引數。實際上,訓練過程解決的就是這樣乙個問題。而模型中,有生成模型和判別模型,那麼生成模型我們求解的是輸入輸出的乙個聯合概率分布,那麼判別模型是乙個條件概率分布。而不管怎麼樣,很多情況下,我們關注的目標都是分布,那麼利用資料進行訓練的過程也就是學習這個分布的過程。

概率統計的乙個作用就是利用模型推斷資料。當給定這個模型,我們給到乙個輸入,我輸入可能是乙個特徵,一些特徵的組合,形成乙個向量。我們把這個輸入的向量代入到模型當中,就可以求出乙個結果,當然也可能是多個結果。我們取這個概率最大的結果作為乙個輸出,這個過程就是反過來利用模型去推斷資料的乙個過程。所以我們說,概率統計等於模型和資料的乙個組合,這個組合是雙向的。在學習階段,我們利用資料來訓練模型,在**階段,我們利用模型反過來去推斷這個資料。

從中我們不難發現,在概率統計這一方面,我們關注的是模型的使用,還有概率的求解。而這兩者是相互融合的。在建立模型的時候,我們會利用到一些先驗概率分布。在求解目標函式的時候,我們也會用到求解數學期望這樣一些操作。

在這篇文章中我們給大家介紹了關於機器學習中概率統計的作用,相信大家已經知道了數學在機器學習中有很多的作用了吧?大家在進行機器學習的時候還是要做到數學知識的儲備,希望這篇文章能夠更好地幫助大家。

輕鬆搞定機器學習中的概率統計知識

網上關於機器學習中的數學基礎知識的文章非常混雜。有些文章推薦太過全面,比如推薦 mit 線性代數 微積分入門 概率論入門 等系列課程和書籍,這對初學者非常的不友好。而有些文章又過於簡略,機器學習雖說不用精通各類數學知識,但全面理解相關數學基礎也是非常關鍵的,很多作者想一篇文章概括所有在機器學習中重要...

機器學習和概率統計的關係

機器學習是乙個比較寬泛的概念,主要包括有監督學習,無監督學習,強化學習等,每個分類又有很多不同的演算法,在使用時需要根據不同的場景進行選擇,這個將會在後續的部落格中涉及,這裡就不展開敘述。現在的機器學習主要都是基於對現有樣本的觀測分析 統計 然後再對未知樣本的 概率 我自己乙個不嚴謹的說法就是機器學...

機器學習中的概率問題

機器學習中的概率問題 機器學習的過程可以理解為計算機通過分析大量的資料獲得模型,並通過獲得的模型進行 的過程。機器學習的模型可以有多種表示,例如線性回歸模型,svm模型,決策樹模型,貝葉斯模型。概率型別 在理解概率模型之前,首先要理解的各種概率型別所表示的確切含義。1.先驗概率 某事件發生的概率。2...