AUC計算方法總結

2021-09-10 01:47:11 字數 566 閱讀 2908

在機器學習的分類問題中,尤其是二分類問題中,常常需要有評判標準,那麼在這些評判標準中,最常用的就是準確率、召回率、roc和auc。

其中,在實際使用中,我們往往使用auc作為評判標準,那麼如何計算auc就是非常重要的。在常見的方法中,最常用的就是通過計算roc,然後計算roc下與x軸圍成的面積作為auc的值,但是這種方法非常簡單,不會用於實際計算中。所以我們需要另外尋找方法來計算。那麼,這就出現了一種非常暴力但簡單的方法來計算auc。

因為如同lr演算法那樣,計算得到的值是乙個score,表示該樣本在當前lr模型下,被判定為正樣本的概率,那麼我們可以對該score進行從大到小排序,然後給每個score指定其排序的序號,例如一共有n個樣本,那麼score最大的那個樣本的排序序號就為n,依次類推;假設一共有m個正樣本,有n個負樣本,那麼最後的auc的計算結果為:

rank表示所有取正樣本的樣本的排序序號求和,通過此方法就能計算出最後的auc值。一般來說,需要auc值越大越好,表明模型的分類效果更佳!

本文參考:

AUC計算方法總結

auc area under the curve 是一種用來度量分類模型好壞的乙個標準,這裡不詳細敘述auc的定義及意義,詳見wiki。演算法1 如下圖是乙個分類器的結果,計算點形成的折線的面積就是auc的值 如下 public double aucalg1 if scores 1 contains...

AUC計算方法總結

一 roc曲線 1 roc曲線 接收者操作特徵 receiveroperating characteristic roc曲線上每個點反映著對同一訊號刺激的感受性。橫軸 負正類率 false postive rate fpr 特異度,劃分例項中所有負例佔所有負例的比例 1 specificity 縱軸...

AUC計算方法總結

一 roc曲線 1 roc曲線 接收者操作特徵 receiveroperating characteristic roc曲線上每個點反映著對同一訊號刺激的感受性。橫軸 負正類率 false postive rate fpr 特異度,劃分例項中所有負例佔所有負例的比例 1 specificity 縱軸...