混淆矩陣
**值=1
**值=0
真實值=1
tpfn
真實值=0
fptn
tp=true postive=真陽性;fp=false positive=假陽性
tn = true negative=假陰性;fn=false negative=假陰性
什麼是查準率/精確率
p re
cisi
on=t
ptp+
fp
precision=\frac
precis
ion=
tp+f
ptp
什麼是查全率/召回率
r ec
all=
tptp
+f
nrecall = \frac
recall
=tp+
fntp
什麼是準確率
a cc
urac
y=tp
+tnt
p+tn
+fp+
fn
accuracy = \frac
accura
cy=t
p+tn
+fp+
fntp
+tn
什麼是f1分數(f1-score)
f1分數可以理解為p和r的調和平均數
f 1=
2prp
+r
f1=2\frac
f1=2p+
rpr
什麼是p-r曲線
p-r曲線就是準確率precision和召回率recall的曲線,以recall作為橫座標,precision作為縱座標。
什麼是roc曲線和auc值
roc曲線是以假陽性率fpr為橫座標,真陽性率tpr為縱座標
t pr
=tpt
p+fn
fpr=
fpfp
+t
ntpr=\frac\\ fpr=\frac
tpr=tp
+fnt
pfp
r=fp
+tnf
pauc表示roc曲線下的面積,主要用於衡量模型的泛化能力,即分類效果的好壞。
如有錯誤,歡迎指正。謝謝
本人部落格
機器學習模型評估總結
acc urac y nc orre ctnt otal accuracy frac accura cy n tota l nc orre ct n co rrec tn ncorre ct 被正確分類的樣本個數 n to taln ntotal 總樣本個數 存在問題 當不同類別的樣本比例不均衡時,...
機器學習之模型評估
準確率是指分類正確的樣本佔總樣個數的比例 accuracy frac n 為被正確分類的樣本個數,n 為總樣本的個數 準確率的侷限性 準確率是分類問題中最簡單也是最直觀的評價指標,但存在明顯的缺陷,當不同總類的樣本比例非常不均衡時,佔比大的類別往往成為影響準確率的最主要因素。比如 當負樣本佔99 分...
機器學習之模型評估與選擇
分為五部分 1 經驗誤差及過擬合 2 評估方法 3 效能度量 4 比較檢驗 5 偏差與方差。錯誤率 error rate 分類錯誤的樣本數佔總樣本數。精度 accuracy 1 錯誤率。誤差 error 學習器的實際 輸出和樣本的真實輸出的差異。在訓練集上的是訓練誤差,在新樣本上的是泛化誤差。過擬合...