混淆矩陣又稱錯誤矩陣,指每個類別下,模型**結果的類別和數量在乙個矩陣中展示出來。
真實標籤
**為正
**為負
真實為正
tpfn
真實為負
fptn
又稱為 tpr (true positive rate)
或者 敏感度sensitivity
通俗理解:真實為正的樣本中識別為正的佔比。
t pr
=tpt
p+fn
tpr = \frac
tpr=tp
+fnt
p又稱為ppv (positive predictive value)
通俗理解:識別為正的樣本中真實為正的佔比。
p pv
=tpt
p+fp
ppv=\frac
ppv=tp
+fpt
p通俗理解:所有樣本中識別正確的比例。
a cc
urac
y=tp
+tnt
p+fn
+fp+
tn
accuracy = \frac
accura
cy=t
p+fn
+fp+
tntp
+tn
直觀理解:閾值降低,召回率公升高時,精度下降情況。
p-r曲線圍起來的面積
把每個類別的ap都單獨拎出來,然後計算所有類別ap的平均值 。
直觀理解:閾值降低,假陽公升高時,真陽公升高情況。
p 為真實的正樣本的數量;
n 為真實的負樣本的數量。
roc曲線圍住的面積。
auc就是從所有正樣本中隨機選取乙個,所有負樣本中隨機選取乙個,然後用分類器**,概率分別為p1、p0,p1>p0的概率就等於auc。所以auc反應的是分類器對樣本的排序能力。根據這個解釋,如果我們完全隨機的對樣本分類,那麼 auc應該接近0.5。另外,auc對樣本是否均衡並不敏感,這也是不均衡樣本通常用auc評價分類器效能的乙個原因。
f 1=
2∗pr
ecis
ion∗
reca
llpr
ecis
ion+
reca
ll
f1 = \frac
f1=pre
cisi
on+r
ecal
l2∗p
reci
sion
∗rec
all
ROC曲線 PR曲線
在 的結果分析中,roc和pr曲線是經常用到的兩個有力的展示圖。1.roc曲線 roc曲線 receiver operating characteristic 是一種對於靈敏度進行描述的功能影象。roc曲線可以通過描述真陽性率 tpr 和假陽性率 fpr 來實現。由於是通過比較兩個操作特徵 tpr和...
PR曲線與ROC曲線
pr曲線中的p代表的是precision 精準率 r代表的是recall 召回率 其代表的是精準率與召回率的關係,一般情況下,將recall設定為橫座標,precision設定為縱座標。在機器學習中,分類器往往輸出的不是類別標號,而是屬於某個類別的概率值,根據分類器的 結果從大到小對樣例進行排序,排...
ROC曲線與PR曲線對比
tpr tpp tpt p fn tpr frac frac tpr pt p t p fn tp fpr fpn fpf p tn fpr frac frac fpr nf p f p tn fp roc曲線的縱座標為tpr,真正率,其實也是召回率。分母為所有實際正樣本。roc曲線的縱座標為fpr...