auc計算公式的理解

2021-09-13 10:49:28 字數 843 閱讀 7568

對於auc的計算參考

m是正樣本的個數,n是負樣本的個數

如何理解分子,下面是我個人的理解。、

總體原則:負樣本數 = 樣本總數 - 正樣本數,然後構造樣本總數

每次取概率不同的正樣本,其排序也不一樣,構造樣本總數的表達方式也不一樣

rank1,   樣本總數為rank1

rank2 , 再加1個就是樣本總數,為rank2 + 1

rank3 , 再加2個就是樣本總數,為rank3 + 2

如此類推

對**的概率值進行從大到小排序,排名第一的為rank1,此時總樣本的個數也是rank1(m+n),那麼負樣本的個數就是樣本總數-負樣本數 = rank1 - m。此時排名為rank1的正樣本與負樣本的組合數就是負樣本的個數 

接下來計算rank2時負樣本的個數,樣本總數為rank2 + 1 ,正樣本數時m,那麼負樣本數rank2+1-m。同樣,此時排名為rank2的正樣本與負樣本的組合數就是負樣本的個數 即rank2+1-m

如此類推

那麼排名為最後乙個的正樣本rankm,樣本總數 為rankm + m-1,負樣本數為(rankm + m-1 )-m = rankm -1 

總體的情況就是 (rank1 - m) + (rank2+1-m) + 。。。+(rankm -1) =(rank1 + rank2 + ...+rankm)- (1 +...+m-1 +m)

(1 +...+m-1 +m)就是m(m+1)/2

形象理解AUC計算公式

auc是評價乙個二分類器效能的主流數值指標,定義為roc曲線下方的面積,但這個算起來比較複雜,需要統計假陽性。另乙個定義更直觀,隨機給乙個正樣本和乙個負樣本,多大概率正樣本的score更高。換一種說法,假設正樣本有m mm個,負樣本有n nn個,在所有m n m nm n個正負樣本對中,有多少正樣本...

auc計算公式 AUC與logloss

在ctr預估中,auc area under curve 用於衡量排序能力,auc值為roc曲線下的面積,是乙個概率值,越大越好。簡單來說這個指標的含義其實就是隨機抽出一對樣本 乙個正樣本,乙個負樣本 然後用訓練得到的分類器來對這兩個樣本進行 得到正樣本的概率大於負樣本概率的概率。auc是乙個二分類...

機器學習評價指標AUC計算公式

auc are under curve 是乙個模型的評價指標,用於分類任務。那麼這個指標代表什麼呢?這個指標想表達的含義,簡單來說其實就是隨機抽出一對樣本 乙個正樣本,乙個負樣本 然後用訓練得到的分類器來對這兩個樣本進行 得到正樣本的概率大於負樣本概率的概率。在有m個正樣本,n個負樣本的資料集裡。一...