ks值和auc值的關係

2021-08-15 22:56:58 字數 531 閱讀 6185

要弄明白ks值和auc值的關係首先要弄懂roc曲線和ks曲線是怎麼畫出來的。其實從某個角度上來講roc曲線和ks曲線是一回事,只是橫縱座標的取法不同而已。拿邏輯回歸舉例,模型訓練完成之後每個樣本都會得到乙個類概率值(注意是類似的類),把樣本按這個類概率值排序後分成10等份,每乙份單獨計算它的真正率和假正率,然後計算累計概率值,用真正率和假正率的累計做為座標畫出來的就是roc曲線,用10等分做為橫座標,用真正率和假正率的累計值分別做為縱座標就得到兩個曲線,這就是ks曲線。auc值就是roc曲線下放的面積值,而ks值就是ks曲線中兩條曲線之間的最大間隔距離。由於ks值能找出模型中差異最大的乙個分段,因此適合用於cut_off,像評分卡這種就很適合用ks值來評估。但是ks值只能反映出哪個分段是區分最大的,而不能總體反映出所有分段的效果,因果auc值更能勝任。

roc值一般在0.5-1.0之間。值越大表示模型判斷準確性越高,即越接近1越好。roc=0.5表示模型的**能力與隨機結果沒有差別。

ks值表示了模型將+和-區分開來的能力。值越大,模型的**準確性越好。一般,ks>0.2即可認為模型有比較好的**準確性。

AUC的相關知識及K S曲線和K S值介紹

tp fn fp tn如圖 如何計算畫roc曲線,我們將所有所有資料按照 概率有小到大排列 trr tp tp f n left frac right tp fn tp 又稱真正率 fpr fp fp t n left frac right fp tn fp 又稱負正率或假正率 roc曲線的橫軸為f...

模型指標 ks,gini值,auc的關係

下邊簡單談一下自己的理解 先說一下ks 將所有樣本根據分數值從低到高排序 即壞賬率從高到低 均分成10組,分別計算這10組的實際好樣本數 壞樣本數 累積好樣本數 累積壞樣本數 累積好樣本數佔比 累積壞樣本數佔比,差值。其中實際好壞樣本數分別為該組內的好壞樣本數,累積好壞樣本數為該組累積的好壞樣本數,...

ks 曲線 R語言計算KS值 繪製KS曲線

將 封裝在函式plotks n裡,pred var是 結果,可以是評分或概率形式 labels var是好壞標籤,取值為1或0,1代表壞客戶,0代表好客戶 descending用於控制資料按違約概率降序排列,如果pred var是評分,則descending 0,如果pred var是概率形式,則d...