標準評分卡分數計算原理 邏輯回歸結果轉換為評分卡

2021-10-16 10:47:36 字數 1870 閱讀 9346

這一期咱們聊聊如何將邏輯回歸的引數結果轉換為評分卡形式。

首先將客戶逾期的概率表示為p,則正常的概率為1-p。二者的比值即odds的計算公式如下:

反過來,如果知道客戶的odds,則客戶逾期的概率p可表示為:

要將邏輯回歸模型的引數轉換為評分卡,我們需要如下的公式:

其中,a和b是常數。式中的負號可以使得逾期概率越低,得分越高。通常情況下,這是分值的理想變動方向,即高分值代表低風險,低分值代表高風險。

其中的log(odds)為邏輯回歸模型計算出的結果,如下所示:

根據資料擬合後,可以得到模型引數β0,β1,…,βn。

式中的常數a、b的值可以通過將兩個已知或假設的分值帶入計算得到。

通常情況下,需要有兩個前提假設才能計算出a、b的值:

(1)給某個特定的比率設定特定的預期分值(p);

(2)確定比率翻番的分數(pdo)

根據以上的分析,我們首先假設比率為x的特定點的分值為p。則比率為2x的點的分值應該為p-pdo。代入式中,可以得到如下兩個等式:

解方程組可以得到:b=pdo/log(2);a=p-b*log(x)

假定我們設定好壞比1:1時分數是500,好壞比翻倍的分數(pdo)為20分,代入式中求得:b=20/log(2),a=500。

評分卡刻度引數a和b確定以後,就可以計算比率和違約概率,以及對應的分值了。

則評分卡的分值可表達為:

其中的變數x1…xn就是出現在最終模型中的自變數,即為入模指標。由於此時所有變數都用woe轉換進行了轉換,可以將這些自變數中的每乙個都寫(βiωij)δij的形式:

其中ωij為xi變數的第j個分組的woe;βi為邏輯回歸方程中的係數,為已知變數;δij為二元變數(0/1),表示變數xi是否取第j個值,因為每乙個入模變數只會在某條記錄上取乙個值,例:x1變數的取值為第2個分組,則δ12取1,δ11,δ13…δ1j取值均為0。上式可重新表示為:

此式即為最終評分卡公式。如果x1…xn變數取不同分組並計算其woe值,式中表示的標準評分卡格式,如下表所示:

變數x1有k1個分組,變數x2有k2個分組,以此類推;基礎分值等於(a−bβ0);變數xi的第j行的分值取決於以下三個數值:

(1)刻度因子b;

(2)邏輯回歸方程的引數βi;

(3)該分組的woe值,ωij;

好了,這期就聊到這裡,下期再見!

通俗易懂的解釋評分卡刻度原理

違約概率 p 比率 違約概率 正常概率 odds p 1 p 評分卡分值 表示為比率對數的線性表示式 score a b log odds a b是常數,負號的作用使得違約概率越低,分數越高。logistic回歸模型 l og odd s 1 x1 p xplog odds 1 x1 p x p l...

機器學習 信用風險評估評分卡建模方法及原理

阿里雲大學免費課程 機器學習 信用風險評估評分卡建模方法及原理 課程介紹 信用風險評分卡為信用風險管理提供了一種有效的 經驗性的解決方法,是消費信貸管理中廣泛應用的技術手段。評分卡是信用風險評估領域常見的建模方法。評分卡並不加單對應於某一種機器學習演算法,而是一種通用的建模框架,講原始資料通過分箱後...

機器學習 信用風險評估評分卡建模方法及原理

信用風險評級模型的型別 信用風險計量體系包括主體評級模型和債項評級兩部分。主體評級和債項評級均有一系列評級模型組成,其中主體評級模型可用 四張卡 來表示,分別是a卡 b卡 c卡和f卡 債項評級模型通常按照主體的融資用途,分為企業融資模型 現金流融資模型和專案融資模型等。a卡,又稱為申請者評級模型,主...