錯誤率是分類錯誤的樣本數佔總樣本數的比例;
精度是分類正確的樣本數佔總樣本數的比例
查準率p:真正例/**為正的樣本數=tp/(tp+fp),是指挑出來的東西裡,有多少是好的。
查全率r:真正例/實際為正的樣本數=tp/(tp+fn),是指全部的好東西,挑出來了多大比例。
p-r圖:查全率為橫軸,查準率為縱軸,包線在外者效能優良。
平衡點bep是查全率=查準率時的取值,綜合考慮查全率、查準率的效能度量
f1:2pr/(p+r)
roc曲線代表泛化效能的好壞,縱軸為真正例率tpr,橫軸為假正例率fpr。auc是roc曲線與橫軸之間的面積
tpr=tp/(tp+fn),fpr=fp/(fp+tn)。
對角線對應於「隨機猜測」模型,點(0,1)對應於將所有正例排在所有反例之前的「理想模型」
分類效能度量指標
正確率 precision tp tp fp 給出的是 為正例的樣本中的真正正例的比例。召回率 recall tp tp fn 給出的是 為正例中的真實正例佔所有真實正例的比例。f 度量值 f score 組合precision和recall為乙個單獨的得分,被定義為精確度和召回率的調和平均數 2 ...
分類器效能度量
一般情況下,分類器的好壞是通過錯誤率來衡量的。錯誤率指的是在測試資料中錯誤分類的樣本所佔比例。然而,這樣進行度量掩蓋了樣例如何被分錯的原因。三類問題混淆矩陣示例 當該矩陣中非對角元素均為0,那麼就會得到完美的分類器。二分類混淆矩陣 在分類中,當某個類別的重要性高於其他類別時,可以利用上述定義來得到比...
分類器效能度量
真陽性tp 為正樣本,實際也為正樣本的特徵數 假陽性fp 為正樣本,實際為負樣本的特徵數 真陰性tn 為負樣本,實際也為負樣本的特徵數 假陰性fn 為負樣本,實際為正樣本的特徵數 正確率 精確率 tp tp fp p 覆蓋率 召回率 tp tp fn r 特異性 tn fp tn s 靈敏度 tp ...