從期末複習開始頹廢了有一陣…………
開始接觸機器學習,今天讀了一些部落格……整理一下思路……主要是自己的理解……所以可能沒那麼準確……
首先分類器指的是根據乙個事物的一些特徵來判斷事物的類別。
對於乙個事物x有類別,那麼對於類別集中最大的p(yi|x),可以認為x即為yi。所以需要算出每乙個p(yi|x),但是這很難直接算出,通過貝葉斯定理p(b|a)=p(a|b)*p(b)/p(a)可以得知p(yi|x)=p(x|yi)*p(yi)/p(x),所有可能性的分母是一樣的,所以只需要將分子最大化,p(x|yi)可以通過統計樣本得出。
假設x具有a1,a2兩種屬性,a1和a2取值分別可以為0或1,類別集為,假設a1和a2獨立,則p(x|yi)=p(a1|yi)*p(a2|yi)。通過統計樣本可以得出以下數值p(y1),p(y2),p(a1=0|y1),p(a1=1|y1),p(a2=0|y1),p(a2=1|y1),p(a1=0|y2),p(a1=1|y2),p(a2=0|y2),p(a2=1|y2),假設x為a1=0,a2=1,所以x為類別y1的概率為:
p(y1|x)=p(x|y1)*p(y1)/p(x)=p(a1=0|y1)*p(a2=1|y1)*p(y1)/p(x)
x為類別y2的公式以此類推。
忽略分母,比較分子的大小之後就可以認為x是概率較大的一類。
樸素貝葉斯分類器
p a b frac 類別 結果 a出現在特徵b樣本裡的概率 frac 假設乙個學校裡有60 男生和40 女生。女生穿褲子的人數和穿裙子的人數相等,所有男生穿褲子。隨機看到了乙個穿褲子的學生,那麼這個學生是女生的概率是多少?begin 特徵 穿褲子 類別 女生 p 女生 穿褲子 frac frac ...
樸素貝葉斯分類器
樸素貝葉斯分類器是用來做分類的乙個簡便方法。在貝葉斯公式的基礎上,引人條件獨立的假設,使得貝葉斯分類器具有簡單易行的優點和假設時常與實際不符的缺點。下面簡單介紹一下樸素貝葉斯分類器。首先規定一下資料格式 輸入的每乙個樣本為 其中 i 為樣本編號,x 為樣本的特徵,是乙個 n 維向量,x cdots ...
樸素貝葉斯分類器
所謂 條件概率 conditional probability 就是指在事件b發生的情況下,事件a發生的概率,用p a b 來表示。根據文氏圖,可以發現 同理可得,所以,即 其中,p a 稱為 先驗概率 prior probability 即在b事件發生之前,我們對a事件概率的乙個判斷 p a b ...