已知混淆矩陣
prediction positive
prediction negative
actuality positive
true positive(tp)
false negative(fn)
actuality negative
false positive(fp)
true negative(tn)
其中:precise(精確率/查準率)= tpt
p+fp
\frac
tp+fpt
p,表示所有**為positive的集合中實際為positive的頻率;
recall(召回率/查全率)= tpt
p+fn
\frac
tp+fnt
p,表示所有實際為positive的集合中**為positive的頻率。
1、「p-r」曲線
對我們來說,p
pp 和 r
rr 都為1的模型是最完美的,但實際情況卻並不像我們想的那樣,通過「 p
pp-r
rr」曲線,對模型判斷
為了防止極端小的 p和r
p 和 r
p和r 值影響我們對模型的判斷,一般通過曲線下面積或 p=r
p=rp=
r 的平衡點作為判別標準。以平衡點判別被認為過於簡單。
2、f
1f_1
f1值(p和r的調和平均數)
引如f
1f_1
f1值作為二分類問題的模型效能度量標準
f 1=
2prp
+r
f_1=\frac
f1=p+
r2pr
這裡f
1f_1
f1是基於 p
pp 和 r
rr 的調和平均數,即 f
1f_1
f1 的倒數為 p
pp 和 r
rr 的倒數之和的二分之一1f1
=(1p
+1r)
×1
2\frac=(\frac+\frac)\times\frac
f11=
(p1
+r1
)×21
在統計學中,調和平均數(f
ff)、幾何平均數(g
gg)、算數平均數(x
‾\overline x
x)它們之間的關係用公式表示為
f ≤g
≤x
‾f\le g\le \overline x
f≤g≤
x其中,f=2
aba+
bf=\frac
f=a+b2
ab、g=a
bg=\sqrt
g=ab、x‾=
a+b2
\overline x=\frac
x=2a+b
,當且僅當 a=b
a=ba=
b 時上面等式成立
證明如下:
假設存在 a,b
>
0a,b\gt 0
a,b>0,則
( a+
b)2−
(2ab
)2
(a+b)^-(2\sqrt)^
(a+b)2
−(2a
b)2
= a2
+b2+
2ab−
4a
b=a^+b^+2ab-4ab
=a2+b2
+2ab
−4ab
= a2
+b2−
2a
b=a^+b^-2ab
=a2+b2
−2ab
= (a
−b)2
≥0
=(a-b)^\ge 0
=(a−b)
2≥0,當且僅當 a=b
a=ba=
b 時等式成立
即 ( a+
b)2≥
(2ab
)2
(a+b)^\ge (2\sqrt)^
(a+b)2
≥(2a
b)2
已知 a,b
>
0a,b\gt 0
a,b>
0,則a+b
≥2ab
a+b\ge2\sqrt
a+b≥2a
b推出 2ab
a+b≤
abab
≤ab≤
a+b2
\frac\le\frac}\le\sqrt \le\frac
a+b2ab
≤ab
ab
≤ab
≤2a+
b當且僅當 a=b
a=ba=
b 時等式成立
即證。這三種平均數各有利弊,但調和平均數受極端值影響較大,更適合評價不平衡資料的分類問題。
3、舉例
已知三種模型得到的 p
pp 和 r
rr 值如下,分別計算三種平均數
p ppr
rrx
‾\overline xxgg
gf1
f_1f1
algorithm 1
0.50.4
0.45
0.45
0.44
algorithm 2
0.70.1
0.40.27
0.18
algorithm 3
0.02
1.00.51
0.14
0.04
可以看出演算法3的 p
pp 值非常小,我們認為此模型效果不好,但是利用算數平均數和幾何平均數來衡量並不能表現出來,只有 f
1f_1
f1 對極端值比較重視,能夠感受到這種變化。
參考[1]統計學
[2]機器學習基礎-模型效能度量
F1 專業術語
f1年度錦標o積分制 championship points f1的年度錦標分為兩種 車手錦標及車隊錦標。在很多f1專家的眼中,車隊錦標的價值大於車手錦標。計分方式是採用積分制,車手與車隊的積分都是相加累積的。f1賽事成績的評分是由國際汽聯 fia 依據每站賽程比賽的結果來評定積分的。每站f1比賽的...
F1賽車的起源
作為世界上三大體育運動之一,f1是一項高科技 高費用 高速度的運動。但首先是汽車運動。f1起源與車,其落腳點也必然是車。因為賽車是聯結整個f1產業鏈的紐帶。拿盛極一時法拉利車隊為例,如果離開了法拉利汽車公司,其結果就是失去競爭力,甚至退出f1舞台。同樣,由於福特的去意,美洲虎車隊已經瀕臨退出f1的邊...
準確率 精確率 召回率 F1值
1.tp tn fp fn 圓的部分認定為檢測後是陽性的,其餘部分為檢測為陰性的 但是現在的情況是檢測並不完全準確,有可能檢測時陰性,但實際上已經有新冠,只是無症狀 現在只看園內,園的左半綠色部分意思是 實際上這個人是新冠患者 右辦粉色部分則為實際並不是新冠患者 那麼圓內綠色部分則為 真陽 對應 正...