機器學習 樸素貝葉斯分類器

2021-07-04 06:59:27 字數 765 閱讀 1398

假設現在要構建乙個網路圖書館,我們可以給新進來的書貼上若干個標籤,沒有機器學習演算法的情況下,我們需要給這些書手動分類,是計算機類的呀,還是非計算機類的呀,是**類的呀,還是非**類的云云。

那麼,我們可以通過讓程式自己學習如何通過一本書上的若干標籤來進行圖書類別的區分,這樣就可以節省很多人力,這也是機器學習的魅力體現。

機器學習的基本原理是通過開發者給出這個程式乙個學習集進行學習,再通過使用者給的使用者資料集進行學習的過程,機器學習包含很多的演算法,當然,有大量資料的前提下,機器學習就和統計學密不可分,學習的時候有很高的耦合。這個圖書館圖書分類器就是用到了概率論中的貝葉斯公式。

很奇怪為什麼圖書分類能和乙個概率**式掛上關係對吧?下面就詳細分析一下:

首先,先回顧一下用到的概率論知識,這裡需要知道兩個公式,乙個是條件概率公式,另乙個就是貝葉斯公式啦。

條件概率公式:設a,b是兩個條件

p(a|b)=p(ab)/p(b)

什麼意思呢?就是說,如果a發生的條件是b先發生,那麼a發生的概率就是b發生的前提下a和b同時發生。這就是上面那個公式的意義了。舉個栗子來說,小紅進女廁所,分析一下,首先小紅得是個女的,然後她才能進了女廁所。。。這就是小紅是女的的前提下小紅進了女廁所,如果小紅是女的事件為a,小紅進女廁所事件為b,那這個概率就是p(b|a)=p(ab)/p(a),就是這個意思(隨便舉個栗子不要介意。。。簡單明瞭嘛)。

貝葉斯公式是基於條件概率的

p(a|b)=p(b|a)*p(a)/p(b)

樸素貝葉斯分類器

p a b frac 類別 結果 a出現在特徵b樣本裡的概率 frac 假設乙個學校裡有60 男生和40 女生。女生穿褲子的人數和穿裙子的人數相等,所有男生穿褲子。隨機看到了乙個穿褲子的學生,那麼這個學生是女生的概率是多少?begin 特徵 穿褲子 類別 女生 p 女生 穿褲子 frac frac ...

樸素貝葉斯分類器

樸素貝葉斯分類器是用來做分類的乙個簡便方法。在貝葉斯公式的基礎上,引人條件獨立的假設,使得貝葉斯分類器具有簡單易行的優點和假設時常與實際不符的缺點。下面簡單介紹一下樸素貝葉斯分類器。首先規定一下資料格式 輸入的每乙個樣本為 其中 i 為樣本編號,x 為樣本的特徵,是乙個 n 維向量,x cdots ...

樸素貝葉斯分類器

所謂 條件概率 conditional probability 就是指在事件b發生的情況下,事件a發生的概率,用p a b 來表示。根據文氏圖,可以發現 同理可得,所以,即 其中,p a 稱為 先驗概率 prior probability 即在b事件發生之前,我們對a事件概率的乙個判斷 p a b ...