\[p(a|b) = \frac
\]\[類別(結果)a出現在特徵b樣本裡的概率 = \frac
\]假設乙個學校裡有60%男生和40%女生。女生穿褲子的人數和穿裙子的人數相等,所有男生穿褲子。
隨機看到了乙個穿褲子的學生,那麼這個學生是女生的概率是多少?
\[ \begin
特徵:& 穿褲子 \\
類別:& 女生 \\
p(女生|穿褲子) & = \frac \\
& = \frac \\
& = \frac \\
& = 25\%
\end \]
隨機看到了乙個穿裙子的學生,那麼這個學生是男生的概率是多少?
\[ \begin
p(男生|穿裙子) & = \frac \\
& = \frac \\
& = 0\%
\end \]
前提:特徵 x、y、z 相互獨立無聯絡
\[p(a|xyz) = \frac = \frac
\]如果一對男女朋友,男生想女生求婚,男生的四個特點分別是不帥,性格不好,身高矮,不上進,請判斷一下女生是嫁還是不嫁?
已有樣本如下:
樣本特徵1 [外貌]
特徵2 [性格]
特徵3 [身高]
特徵3 [進取]
類別a [嫁]1帥
不好矮不上進不嫁2不帥
好矮上進不嫁3帥
好矮上進嫁
4不帥好高
上進嫁5帥
不好矮上進不嫁6不帥
不好矮不上進不嫁7帥
好高不上進嫁8不帥
好中上進嫁
9帥好中
上進嫁10不帥不好高
上進嫁11帥
好矮不上進不嫁12帥
好矮不上進不嫁
\[ \begin
p(嫁|不帥、不好、矮、不上進) & = \frac \\
& = \frac \\
其中: & \\
p(嫁) & = \frac \qquad(12個樣本裡類別[嫁]佔6個) \\
p(不帥|嫁) & = \frac \qquad(6個[嫁]的樣本裡不帥佔3個) \\
p(不好|嫁) & = \frac \qquad(6個[嫁]的樣本裡不好佔1個) \\
p(矮|嫁) & = \frac \qquad(6個[嫁]的樣本裡矮佔1個) \\
p(不上進|嫁) & = \frac \qquad(6個[嫁]的樣本裡不上進占1個) \\
p(不帥) & = \frac \\
p(不好) & = \frac\\
p(矮) & = \frac\\
p(不上進) & = \frac \\
p(嫁|不帥、不好、矮、不上進) & = \frac*\frac*\frac*\frac*\frac}*\frac*\frac*\frac} \\
& = \frac*\frac \\
\end \]
樸素貝葉斯分類器
樸素貝葉斯分類器是用來做分類的乙個簡便方法。在貝葉斯公式的基礎上,引人條件獨立的假設,使得貝葉斯分類器具有簡單易行的優點和假設時常與實際不符的缺點。下面簡單介紹一下樸素貝葉斯分類器。首先規定一下資料格式 輸入的每乙個樣本為 其中 i 為樣本編號,x 為樣本的特徵,是乙個 n 維向量,x cdots ...
樸素貝葉斯分類器
所謂 條件概率 conditional probability 就是指在事件b發生的情況下,事件a發生的概率,用p a b 來表示。根據文氏圖,可以發現 同理可得,所以,即 其中,p a 稱為 先驗概率 prior probability 即在b事件發生之前,我們對a事件概率的乙個判斷 p a b ...
樸素貝葉斯分類器初探
從期末複習開始頹廢了有一陣 開始接觸機器學習,今天讀了一些部落格 整理一下思路 主要是自己的理解 所以可能沒那麼準確 首先分類器指的是根據乙個事物的一些特徵來判斷事物的類別。對於乙個事物x有類別,那麼對於類別集中最大的p yi x 可以認為x即為yi。所以需要算出每乙個p yi x 但是這很難直接算...