基於邏輯回歸模型的評分卡構建

2021-10-10 04:18:51 字數 3294 閱讀 4694

lr模型對進入模型變數的要求

1、變數間不存在較強的線性相關性和多重共線性

2、變數具有顯著性

3、變數具有合理的業務含義,符合業務邏輯

第1點,可以使用單變數分析和多變數分析得到一定的約束,但是未必充分;

第2點,從係數的p值進行檢驗;

第3點,從係數的符號進行檢驗。

變數的顯著性

為了獲取與目標變數有較高相關性的變數,要求最終入模的變數的係數的p值很小,例如低於0.1。如果發現模型中某些變數不顯著,需要檢驗一下兩種可能性:

1、該變數本身不顯著;

2、該變數顯著,但是由於有一定的線性相關性或者多重共線性,導致該變數在多元回歸下不顯著。

先檢驗1的可能性,如果排除,再檢驗2

檢驗1的方法:

將該變數單獨與目標變數做邏輯回歸模型,如果在單變數回歸的情況下,係數的p值仍然較高,即表明該變數本身的顯著性較低。

注:對於iv值較高的變數,1的可能性較低。

變數的正確性

在woe的計算公式中,

w oe

i=

log⁡(g

oodi

/goo

dtot

alba

di/b

adto

tal)

==

log⁡(g

oodi

badi

)−

log⁡(g

oodt

otal

badt

otal

)woe_i = \log\left(\frac/good_}/bad_}\right)==\log\left(\frac}}\right)-\log\left(\frac}}\right)

woei​=

log(ba

di​/

badt

otal

​goo

di​/

good

tota

l​​)

==log(ba

di​g

oodi

​​)−

log(ba

dtot

al​g

oodt

otal

​​)當woe為負時,表明當前箱的」危險性「高於平均樣本的」危險性「,出現壞樣本的概率更高,因此在邏輯回歸模型中,所有變數對應的係數應該為負。

反之,如果採取的woe的計算公式為:

w oe

i=

log⁡(b

adi/

badt

otal

good

i/go

odto

tal)

==

log⁡(b

adig

oodi

)−

log⁡(b

adto

talg

oodt

otal

)woe_i = \log\left(\frac/bad_}/good_}\right)==\log\left(\frac}}\right)-\log\left(\frac}}\right)

woei​=

log(go

odi​

/goo

dtot

al​b

adi​

/bad

tota

l​​)

==log(go

odi​

badi

​​)−

log(go

odto

tal​

badt

otal

​​)同理,所有變數對應的係數應該為正。

評分卡分數轉化

由概率轉化為分數需要滿足如下條件:

(1)樣本總的分數是由每個變數的分數之和累加得到;

(2)模型**概率的變化會引起分值以某一單位刻度發生變化;

(3)每個樣本的取值發生變化會引起樣本分值的改變。

為了滿足條件(1),而引入機率(odds)的定義,odds可以衡量模型**結果為正例可能性的大小。

o dd

s=p1

−p

odds = \frac

odds=1

−pp​

p為模型**正樣本的概率。

l og

p1−p

=wtx

=w0+

w1x1

+...

+wnx

nlog\frac=w^tx=w_0 + w_1x_1 +... + w_nx_n

log1−p

p​=w

tx=w

0​+w

1​x1

​+..

.+wn

​xn​

等式左邊是模型輸出概率的對數機率,而等式右邊是不同變數的線性加權表示,這正是條件(1)需要尋找的一種解決辦法,巧妙地將概率相關表達對映為變數加權的方式。

s co

re=a

−blo

g(od

ds)=

a−b(

w0+w

1x1+

...+

wnxn

)score = a - blog(odds)= a - b(w_0 + w_1x_1 +... + w_nx_n)

score=

a−bl

og(o

dds)

=a−b

(w0​

+w1​

x1​+

...+

wn​x

n​)其中,a稱為補償,b稱為刻度

變數的分值計算

評分卡模型效能評估

常用的審批策略包括:壞賬率與通過率的審批策略,雙卡審批策略

1、穩定性監控:psi指標

2、單調性監控:kendall』s tau指標

3、效能監控指標:ks值、auc值、ar值、recall、precision等

模型上線監控指標

指標類別

指標名稱

指標偏好

穩定性指標

psi越小越好

單調性指標

kendall』s tau值

越接近1越好

效能指標

ks、auc、ar、recall、precision等

越接近模型開發時越好

業務指標

壞賬率、通過率

越接近模型開發時越好

構建風控評分卡模型介紹(WOE KS ROC

什麼是評分卡 信貸場景中 以分數的形式來衡量風險機率的一種手段 對未來一段時間內違約 逾期 失聯概率的 通常評分越高越安全 根據使用場景分為反欺詐評分卡 申請評分卡 行為評分卡 催收評分卡 為什麼要開發評分卡 評分卡的特性 評分卡開發的常用模型 基於邏輯回歸的評分卡理論依據 單變數 歸一化,離散化,...

標準評分卡分數計算原理 邏輯回歸結果轉換為評分卡

這一期咱們聊聊如何將邏輯回歸的引數結果轉換為評分卡形式。首先將客戶逾期的概率表示為p,則正常的概率為1 p。二者的比值即odds的計算公式如下 反過來,如果知道客戶的odds,則客戶逾期的概率p可表示為 要將邏輯回歸模型的引數轉換為評分卡,我們需要如下的公式 其中,a和b是常數。式中的負號可以使得逾...

評分卡模型的監測和報告

cdot 基於sas的開發與實施 評分卡報告分為兩類 評分卡在企業中的作用,可以用來回答以下問題 如何將評分卡與企業的總體經營戰略相結合 如何衡量客戶行為的變化並在信貸策略中對其原因進行說明 評分卡是否執行良好,何時需要對評分卡進行公升級或重建。穩定性報告時用於評估和檢測評分卡表現的。目的是生成乙個...