多分類建模評估指標

2022-07-06 00:24:07 字數 1470 閱讀 9633

作為機器學習實踐中分類領域下的乙個模組,多分類問題建模也是生產生活應用中的重要組成部分;在模型構建完成之後,對多分類模型的評估影響到後期的模型決策甚至是機器學習解決方案的實際應用效果。

準確有效評估多分類模型的效能,有利於我們建立起對當前模型水平的正確認識;由此,本文著重**幾種常用的多分類模型評估指標。

在談及多分類評估指標之前,首先回顧幾個常見的二分類建模評估指標:

true positive (tp):正樣本**為正;

true negative (tn):負樣本**為負;

false positive (fp):負樣本**為正;

false negative (fn):正樣本**為負;

在上述四個指標之上建立的精確率、召回率以及f1值定義如下:

模擬於二分類評估指標,計算出各類別的精確率、召回率,然後求上述精確率和召回率的均值,再按定義求出macro-f1,如下圖(圖中n表示類別數):

當然,另有一派計算macro-f1的公式,即求取各類別f1值的均值,如下圖(圖中n表示類別數):

micro-f1的計算同樣用到各類別的有關指標均值,即算出各類別的tp、fp、tn、fn後再計算這四個指標的均值,然後按定義計算精確率、召回率和micro-f1值,如下圖:

其實,經過數學推導可以發現,在微指標方面有以下等式:

由前述內容,準確率(accuracy)等於微f1值(micro-f1),其最本質的定義是指所有被正確分類的樣本佔總樣本的比例。

在準確率基礎上,還有乙個平均準確率指標,即各類別準確率的均值。

當然,嚴格地說classification_report並不算是乙個評估指標,只是sklearn在內建函式庫中提供了這樣乙個介面,以供檢視上述指標的詳細狀況:

上圖為鳶尾花三分類的分類報告情況;

下圖為該例項的confusion_matrix情況:

多分類建模評估指標相較於二分類的而言,確實要少一些,上述列舉的是多分類指標中最為常用的,希望有所幫助!

多分類評估指標

多分類指標的情況 二分類和多分類其實沒有多少區別。用的公式仍然是y wx b。但有乙個非常大的區別是他們用的啟用函式是不同的。邏輯回歸用的是sigmoid,這個啟用函式的除了給函式增加非線性之外還會把最後的 值轉換成在 0,1 中的資料值。也就是 值是0 我們最後的一層中使用的啟用函式就是softm...

分類演算法評估指標

2 準確率 accuracy 準確率是常用的乙個評價指標,但是不適合樣本不均衡的情況。ac cura cy t p tn tp t n fp fn accuracy tp tn tp tn fp fnac cura cy t p tn tp t n fp fn 3 精確率 precision 又稱查...

分類問題的評估指標

分類的評估指標有很多,這裡考慮如下幾個 precision,recall,f1,macro f1,micro f1 真實10 1tp fp0fntn positive negative 表示 的正負 true false 表示 是否正確 而macro f1和micro f1,巨集觀f1值和微觀f1值...