1、概率描述了已知引數時的隨機變數的輸出結果;似然則用來描述已知隨機變數輸出結果時,未知引數的可能取值。
涉及到似然函式的許多應用中,更方便的是使用似然函式的自然對數形式,即「對數似然函式」
2、最大似然估計是似然函式最初也是最自然的應用。上文已經提到,似然函式取得最大值表示相應的引數能夠使得統計模型最為合理。從這樣乙個想法出發,最
到的結果是相同的。
這個鏈結裡的例子非常好,就是知道最後輸出結果情況正正反反反,然後求解單次拋投硬幣正面的概率為多少時,出現這個結果的可能性最大。
如果我們是求概率的話,就是知道乙個硬幣正面的概率比如是0.5,那麼正正反反反的可能性是0.03125。如果單詞概率是0.4那麼正正反反反
的可能性是0.03456
條件概率:
$p(a|b)=\frac$
b發生的情況下a發生的概率 = ab同時發生的概率 / b發生的概率
全概率公式:
看這個圖理解,整個a事件可以分成和三個b事件相交集合的累加,相交部分用條件概率求得。
貝葉斯公式:
$p(b_|a)=\frac)p(a|b_)}^p(b_)p(a|b_) }$
推導過程:
在事件b發生的條件下事件a發生的概率是 $p(a|b)=\frac$
在事件a發生的條件下事件b發生的概率是 $p(b|a)=\frac$
整理與合併上述兩個方程式,便可以得到 $p(a|b)p(b) = p(ab) = p(b|a)p(a)$
在
機器學習 基本數學概念
1 均值 樣本均值描述的是集合的中間點 平均值 均值的資訊是有限的,有時候甚至是完全沒有參考意義的。2 標準差 標準差描述的是樣本集合中的各個樣本點到均值的距離的平均值。以集合 2,8,12,18 和集合 7,9,11,13 為例,兩者的均值都是10,但顯然後都較為集中,故其標準差小一些。所以標準差...
機器學習概念與數學基礎
一.什麼是機器學習 概率模型 神經網路 都是為了擬合輸入與輸出之間的關係 all models are wrong,but some are useful.george e.p.box 二.機器學習的應用 人工智慧 智慧型系統 計算神經學 機器學習等都是人工智慧的分支 模式識別 訊號 影象 聲音等找...
機器學習 數學 機器學習涉及的數學知識
簡單總結 機器學習涉及的數學知識有 線性代數,概率論和統計學,多變數微積分,演算法和複雜優化,以及其他等。原文 在過去幾個月裡,有幾個人聯絡過我,說他們渴望進軍資料科學領域,使用機器學習 ml 技術探索統計規律,並打造資料驅動的完美產品。但是,據我觀察,一些人缺乏必要的數學直覺和框架,無法獲得有用的...