P R曲線和ROC曲線

2021-09-10 07:29:28 字數 1365 閱讀 7120

混淆矩陣又稱錯誤矩陣,指每個類別下,模型**結果的類別和數量在乙個矩陣中展示出來。

真實標籤

**為正

**為負

真實為正

tpfn

真實為負

fptn

又稱為 tpr (true positive rate)

或者 敏感度sensitivity

通俗理解:真實為正的樣本中識別為正的佔比。

t pr

=tpt

p+fn

tpr = \frac

tpr=tp

+fnt

p​又稱為ppv (positive predictive value)

通俗理解:識別為正的樣本中真實為正的佔比。

p pv

=tpt

p+fp

ppv=\frac

ppv=tp

+fpt

p​通俗理解:所有樣本中識別正確的比例。

a cc

urac

y=tp

+tnt

p+fn

+fp+

tn

accuracy = \frac

accura

cy=t

p+fn

+fp+

tntp

+tn​

直觀理解:閾值降低,召回率公升高時,精度下降情況。

p-r曲線圍起來的面積

把每個類別的ap都單獨拎出來,然後計算所有類別ap的平均值 。

直觀理解:閾值降低,假陽公升高時,真陽公升高情況。

p 為真實的正樣本的數量;

n 為真實的負樣本的數量。

roc曲線圍住的面積。

auc就是從所有正樣本中隨機選取乙個,所有負樣本中隨機選取乙個,然後用分類器**,概率分別為p1、p0,p1>p0的概率就等於auc。所以auc反應的是分類器對樣本的排序能力。根據這個解釋,如果我們完全隨機的對樣本分類,那麼 auc應該接近0.5。另外,auc對樣本是否均衡並不敏感,這也是不均衡樣本通常用auc評價分類器效能的乙個原因。

f 1=

2∗pr

ecis

ion∗

reca

llpr

ecis

ion+

reca

ll

f1 = \frac

f1=pre

cisi

on+r

ecal

l2∗p

reci

sion

∗rec

all​

ROC曲線 PR曲線

在 的結果分析中,roc和pr曲線是經常用到的兩個有力的展示圖。1.roc曲線 roc曲線 receiver operating characteristic 是一種對於靈敏度進行描述的功能影象。roc曲線可以通過描述真陽性率 tpr 和假陽性率 fpr 來實現。由於是通過比較兩個操作特徵 tpr和...

PR曲線與ROC曲線

pr曲線中的p代表的是precision 精準率 r代表的是recall 召回率 其代表的是精準率與召回率的關係,一般情況下,將recall設定為橫座標,precision設定為縱座標。在機器學習中,分類器往往輸出的不是類別標號,而是屬於某個類別的概率值,根據分類器的 結果從大到小對樣例進行排序,排...

ROC曲線與PR曲線對比

tpr tpp tpt p fn tpr frac frac tpr pt p t p fn tp fpr fpn fpf p tn fpr frac frac fpr nf p f p tn fp roc曲線的縱座標為tpr,真正率,其實也是召回率。分母為所有實際正樣本。roc曲線的縱座標為fpr...