分類效能度量指標

2022-06-26 16:57:11 字數 1036 閱讀 3700

正確率(precision),tp/(tp+fp),給出的是**為正例的樣本中的真正正例的比例。

召回率(recall),tp/(tp+fn),給出的是**為正例中的真實正例佔所有真實正例的比例。

f-度量值(f-score),組合precision和recall為乙個單獨的得分,被定義為精確度和召回率的調和平均數(2*precision*recall)/(precision+recall)。

很難同時使兩者達到最好。如果將任何樣本都判為正例,那麼召回率達到百分之百而此時的正確率很低。正確率很高時,往往會造成一些偽反例較多,從而降低召回率。

另乙個用於度量分類中的分均衡性的工具是roc曲線。在上圖roc曲線中,給出了兩條線,一條虛線一條實線。圖中的橫軸是偽正例的比例(假陽率=fp/(fp+tn)),而縱軸是真正例的比例(真陽率=tp/(tp+fn))。roc曲線給出的是當閾值變化時假陽率和真陽率的變化情況。左下角的點對應將所有的樣本判斷為反例的情況,右上角的點對應的是將所有樣例判斷為正例的情況。虛線給出的是隨機猜測的結果曲線。

roc曲線不但可以用於比較分類器,還可以基於成本效益分析來作出決策。由於在不同的閾值下,不同的分類器的表現情況可能各不相同,因此以某種方式將它們組合起來或許會更有意義。如果只是簡單的觀察分類器的錯誤率,那麼我們就難以得到這種更深入的洞察效果了。

理想情況下,最佳的分類器應該盡可能處於左上角。對不同roc曲線進行比較的乙個指標是曲線下的面積(auc)。auc給出的是分類器的平均效能值,當然它不能完全替代對整條曲線的觀察。乙個完美分類器的auc為1,而隨機猜測的auc則為0.5。roc曲線的繪製,根據分類器**分數從大到小對樣本排序,然後設定閾值逐漸隨分數從大到小變化,計算不同閾值下對應的假陽率和真陽率,進而得到整個roc曲線。

混淆矩陣:當處理3個或更多的標籤的分類任務時,基於模型錯誤型別細分模型的錯誤是有資訊量的。乙個混淆矩陣是乙個表,其中每個cells[i,j]表示正確的標籤i被**為標籤j的次數。因此,對角線專案表示正確**的標籤,非對角線專案表示錯誤**。

分類效能度量

錯誤率是分類錯誤的樣本數佔總樣本數的比例 精度是分類正確的樣本數佔總樣本數的比例 查準率p 真正例 為正的樣本數 tp tp fp 是指挑出來的東西裡,有多少是好的。查全率r 真正例 實際為正的樣本數 tp tp fn 是指全部的好東西,挑出來了多大比例。p r圖 查全率為橫軸,查準率為縱軸,包線在...

分類器效能度量

一般情況下,分類器的好壞是通過錯誤率來衡量的。錯誤率指的是在測試資料中錯誤分類的樣本所佔比例。然而,這樣進行度量掩蓋了樣例如何被分錯的原因。三類問題混淆矩陣示例 當該矩陣中非對角元素均為0,那麼就會得到完美的分類器。二分類混淆矩陣 在分類中,當某個類別的重要性高於其他類別時,可以利用上述定義來得到比...

分類器效能度量

真陽性tp 為正樣本,實際也為正樣本的特徵數 假陽性fp 為正樣本,實際為負樣本的特徵數 真陰性tn 為負樣本,實際也為負樣本的特徵數 假陰性fn 為負樣本,實際為正樣本的特徵數 正確率 精確率 tp tp fp p 覆蓋率 召回率 tp tp fn r 特異性 tn fp tn s 靈敏度 tp ...