違約概率:p
比率(違約概率/正常概率): odds=p/(1-p)
評分卡分值:表示為比率對數的線性表示式
score=a-b*log(odds)
a、b是常數,負號的作用使得違約概率越低,分數越高。
logistic回歸模型:
l og
(odd
s)=β
+β1∗
x1+…
+βp∗
xplog(odds)=β+β1*x1+…+β_p*x_p
log(od
ds)=
β+β1
∗x1+
…+βp
∗xp
其中,用建模引數擬合模型可以得到模型引數β(截距),β1,…,βp.
兩個假設:
1.在某個特定的比率設定特定的預期分值(設定比率為θ的特定點的分值為p);
2.指定比率翻番的分數(pdo)(比率為2θ的點的分值為p-pdo).
代入公式score=a-b*log(odds)得到如下等式:
p=a-b*log(θ)
p-pdo=a-b*log(2θ)
解方程:
b=pdo/log(2)
a=p+b*log(θ)
例:假設想要設定評分卡刻度是的比率為(違約比正常)時的分值是600分,pdo=20,然後計算得出:b=28.25 a=481.66
則可以計算分值為:score=481.89-28.85log(odds)
常數a稱為補償,常數b稱為刻度。
分值分配:
score=a-b*log(p/(1-p))
=a-b*
其中,變數x1,…xp是出現在最終模型中的自變數(已經過變數選擇程式)。由於所有變數都已經經過了woe轉換,則可以將這些變數中的每乙個寫成如下展開式:
其中wij是第i個變數的第j個分類的證據權重;σij是二元變數,標識變數i是否取第j個值。基礎分值等於a-b*β0.
評分卡建模過程中面臨的挑戰是:模型引數的確定、變數的分段、分段woe
矩陣策略:用乙個或多個沒有出現在評分卡中的變數建立乙個臨界層,這個臨界層可以表現為乙個簡單的表或決策樹。
memset函式()通俗易懂解釋
memset 函式原型是 extern void memset void buffer,int length,int buf buffer 是指標或者陣列,void是要初始化的首記憶體的首位址 length是要初始化的變為的資料,buf是buffer的長度,即大小。網路程式設計中memset函式多用...
通俗易懂的解釋卷積
著作權歸作者所有。有那麼麻煩嗎?不推薦用 反轉 翻轉 反褶 對稱 等解釋卷積。好好的訊號翻轉了是什麼意義?導致學生難以理解卷積的物理意義。國內的大多數教材在這一點上沒有講透。直接看圖,不信看不懂。以離散訊號為例,連續訊號同理。就四個字 平移 可沒有反褶哈 疊加。從這裡,可以看到卷積的重要的物理意義是...
區塊鏈通俗易懂的解釋
廣義來講,區塊鏈技術是利用塊鏈式資料結構來驗證與儲存資料 利用分布式節點共識演算法來生成和更新資料 利用密碼學的方式保證資料傳輸和訪問的安全 利用由自動化指令碼 組成的智慧型合約來程式設計和運算元據的一種全新的分布式基礎架構與計算正規化。1.區塊鏈是乙個放在非安全環境中的分布式資料庫 系統 2.區塊...