模型 區分度 神秘的KS值和GINI係數

2021-08-09 06:37:10 字數 868 閱讀 7498

有效性指標中的區分能力指標:

ks(kolmogorov-smirnov):ks用於模型風險區分能力進行評估,

指標衡量的是好壞樣本累計分部之間的差值。

好壞樣本累計差異越大,ks指標越大,那麼模型的風險區分能力越強。

ks的計算步驟如下:

1. 計算每個評分區間的好壞賬戶數。

2. 計算每個評分區間的累計好賬戶數占總好賬戶數比率(good%)和累計壞賬戶數佔總壞賬戶數比率(bad%)。

3. 計算每個評分區間累計壞賬戶佔比與累計好賬戶佔比差的絕對值(累計good%-累計bad%),然後對這些絕對值取最大值即得此評分卡的k-s值。

·gini係數:也是用於模型風險區分能力進行評估。

gini統計值衡量壞賬戶數在好賬戶數上的的累積分布與隨機分布曲線之間的面積,好賬戶與壞賬戶分布之間的差異越大,gini指標越高,表明模型的風險區分能力越強。

gini係數的計算步驟如下:

1. 計算每個評分區間的好壞賬戶數。

2. 計算每個評分區間的累計好賬戶數占總好賬戶數比率(累計good%)和累計壞賬戶數佔總壞賬戶數比率(累計bad%)。

3. 按照累計好賬戶佔比和累計壞賬戶佔比得出下圖所示曲線adc。

4. 計算出圖中陰影部分面積,陰影面積佔直角三角形abc面積的百分比,即為gini係數。

模型區分度衡量指標 KS值

ks曲線和roc曲線都用到了tpr,fpr。ks曲線是把tpr和fpr都作為縱座標,而樣本數作為橫座標。但是auc只評價了模型的整體訓練效果,並沒有指出如何劃分類別讓預估的效果達到最好。不同之處在於,ks取的是tpr和fpr差值的最大值。偽陽性率 fpr 判定為正例卻不是真正例的比率 真陽性率 tp...

ks值和auc值的關係

要弄明白ks值和auc值的關係首先要弄懂roc曲線和ks曲線是怎麼畫出來的。其實從某個角度上來講roc曲線和ks曲線是一回事,只是橫縱座標的取法不同而已。拿邏輯回歸舉例,模型訓練完成之後每個樣本都會得到乙個類概率值 注意是類似的類 把樣本按這個類概率值排序後分成10等份,每乙份單獨計算它的真正率和假...

AUC的相關知識及K S曲線和K S值介紹

tp fn fp tn如圖 如何計算畫roc曲線,我們將所有所有資料按照 概率有小到大排列 trr tp tp f n left frac right tp fn tp 又稱真正率 fpr fp fp t n left frac right fp tn fp 又稱負正率或假正率 roc曲線的橫軸為f...