機器學習知識總結 模型評估標準之混淆矩陣

2021-10-17 18:20:23 字數 1230 閱讀 7628

混淆矩陣

**值=1

**值=0

真實值=1

tpfn

真實值=0

fptn

tp=true postive=真陽性;fp=false positive=假陽性

tn = true negative=假陰性;fn=false negative=假陰性

什麼是查準率/精確率

p re

cisi

on=t

ptp+

fp

precision=\frac

precis

ion=

tp+f

ptp​

什麼是查全率/召回率

r ec

all=

tptp

+f

nrecall = \frac

recall

=tp+

fntp

​ 什麼是準確率

a cc

urac

y=tp

+tnt

p+tn

+fp+

fn

accuracy = \frac

accura

cy=t

p+tn

+fp+

fntp

+tn​

什麼是f1分數(f1-score)

f1分數可以理解為p和r的調和平均數

f 1=

2prp

+r

f1=2\frac

f1=2p+

rpr​

什麼是p-r曲線

p-r曲線就是準確率precision和召回率recall的曲線,以recall作為橫座標,precision作為縱座標。

什麼是roc曲線和auc值

roc曲線是以假陽性率fpr為橫座標,真陽性率tpr為縱座標

t pr

=tpt

p+fn

fpr=

fpfp

+t

ntpr=\frac\\ fpr=\frac

tpr=tp

+fnt

p​fp

r=fp

+tnf

p​auc表示roc曲線下的面積,主要用於衡量模型的泛化能力,即分類效果的好壞。

如有錯誤,歡迎指正。謝謝

本人部落格

機器學習模型評估總結

acc urac y nc orre ctnt otal accuracy frac accura cy n tota l nc orre ct n co rrec tn ncorre ct 被正確分類的樣本個數 n to taln ntotal 總樣本個數 存在問題 當不同類別的樣本比例不均衡時,...

機器學習之模型評估

準確率是指分類正確的樣本佔總樣個數的比例 accuracy frac n 為被正確分類的樣本個數,n 為總樣本的個數 準確率的侷限性 準確率是分類問題中最簡單也是最直觀的評價指標,但存在明顯的缺陷,當不同總類的樣本比例非常不均衡時,佔比大的類別往往成為影響準確率的最主要因素。比如 當負樣本佔99 分...

機器學習之模型評估與選擇

分為五部分 1 經驗誤差及過擬合 2 評估方法 3 效能度量 4 比較檢驗 5 偏差與方差。錯誤率 error rate 分類錯誤的樣本數佔總樣本數。精度 accuracy 1 錯誤率。誤差 error 學習器的實際 輸出和樣本的真實輸出的差異。在訓練集上的是訓練誤差,在新樣本上的是泛化誤差。過擬合...