在一般的模式識別問題中,人們的目標往往是儘量減少分類的錯誤,追求最小的錯誤率。根據之前的文章,即求解一種決策規則,使得:mi
np(e
)=∫p
(e|x
)p(x
)dx
這就是最小錯誤率貝葉斯決策。
在上式中,p(
e|x)
≥0,p
(x)≥
0 對於所有的
x 均成立,故mi
np(e
)等同於對所有的
x 最小化p(
e|x)
,即:使後驗概率p(
wi|x
) 最大化。根據貝葉斯公式: p(
wi|x
)=p(
x|wi
)p(w
i)p(
x)=p
(x|w
i)p(
wi)∑
kj=1
p(x|
wj)p
(wj)
,i=1
,2,.
..,k
在上式中,對於所有類別,分母都是相同的,所以決策的時候實際上只需要比較分子,即: 若p
(x|w
i)p(
wi)=
maxk
j=1p
(wj|
x)p(
wi),
則x∈w
i 先驗概率p(
wi) 和類條件概率密度p(
x|wi
) 是已知的。概率密度p(
x|wi
) 反應了在wi
類中觀察到特徵值x的相對可能性(li
keli
hood
)。
舉個簡單的例子還說明最小錯誤貝葉斯決策。
假設某地區檢測到細胞為正常細胞的概率w1
和癌細胞的概率w2
分別為: w1
=0.9,w
2=0.1
現在對於乙個待決策的細胞,其特徵的觀察之為
x ,且從類條件概率密度曲線上分別查得: p(
x|w1
)=0.2,p(
x|w2
)=0.4現在需要對該細胞進行決策,判斷是正常細胞還是癌細胞。根據貝葉斯公式,分別計算出w1
和w2 的後驗概率: p(
w1|x
)=p(
x|w1
)p(w
1)∑2
j=1p
(x|w
j)p(
wj)=
0.2×
0.90.2
×0.9
+0.4
×0.1
=0.818 p
(w2|
x)=1
−p(w
1|x)
=0.182
因為:p(
w1|x
)=0.818
>
0.182=p
(w2|
x),所以更合理的決策是將
x 歸類為w1
,即正常細胞。
說白了,貝葉斯決策就是將待分類物
x 歸類於最大後驗概率的那一類,即: 若p
(wi|
x)=m
axj=
1,..
.,cp
(wj|
x),則
x∈wi
等價於:若p
(x|w
i)p(
wi)=
maxk
j=1p
(wj|
x)p(
wi),
則x∈w
i 貝葉斯公式是用來計算後驗概率的工具。
對於多類別決策,錯誤率的計算量較大,可以轉化為計算平均正確率p(
c)來計算錯誤率: p(
e)=1
−p(c
)=1−
∑j=1
kp(x
∈ri|
wj)p
(wj)
1−∑j
=1kp
(wj)
∫rjp
(x|w
j)dx
基於貝葉斯最小錯誤率決策的分類
基於貝葉斯最小錯誤率決策的分類 假定某個區域性區域細胞識別中正常p w1 和異常p w2 兩類先驗概率分別為p w1 0.9,p w2 0.1現有一系列待觀察的細胞,其觀察值為 2.67 3.55 1.24 0.98 0.79 2.85 2.76 3.73 3.54 2.27 3.45 3.08 1...
最小錯誤貝葉斯決策規則
設c個類 omega omega 分別具有類先驗概率 p omega p omega 如果除了已知這些類概率分布以外,其他資訊不得而知,則使分類錯誤率最小的決策規則是,若物件的 p left w right p left w right k 1,c k neq j 則將該物件歸屬於 w 類。這種分類...