各種統計量指標
(1)weight of evidence(woe)
注:是指每個變數取值的權重,分bin,相當於單維看
連續變數取值分區間,型別變數取離散的值。
(2)informationvalue (iv)
含義:**變數特徵資訊的數量,從壞的中分離出好的。變數不同取值資訊加和。
(3)populationstability index(psi)人口穩定性指標
公式: psi = sum((實際佔比-預期佔比)/ln(實際佔比/預期佔比))
形式上比較像woe和iv,下面是計算舉例:
計算表:
score bands
actual %
expected %
ac-ex
ln(ac/ex)
index
< 251 5%
8%-3%
-0.47
0.014
251–290 6%
9%-3%
-0.41
0.012
291–320 6%
10%-4%
-0.51
0.020
321–350 8%
13%-5%
-0.49
0.024
351–380
10%12%
-2%-0.18
0.004
381–410
12%11% 1%
0.09
0.001
411–440
14%10% 4%
0.34
0.013
441–470
14% 9%
5%0.44
0.022
471–520
13% 9%
4%0.37
0.015
520 < 9%
8% 1%
0.12
0.001
population stability index (psi)=
0.1269
指標取值解釋說明:
psi value
inference
action
less than 0.1
insignificant change
(無關緊要的差距)
no action required
(不需要進一步操作)
0.1 – 0.25
some minor change
(有一點差距)
check other scorecard monitoring metrics
(檢查一下其他度量)
greater than 0.25
major shift in population
(差距較大)
need to delve deeper
(需要進一步研究)
t統計量和z統計量
z統計和t統計可以用來檢驗兩個平均數之間差異顯著的程度,z適合大樣本的情況 樣本數大於30 t適合小樣本的情況。z檢驗的步驟 h0 1 第二步 計算統計量z值,對於不同型別的問題選用不同的統計量計算方法,1 如果檢驗乙個樣本平均數 的差異是否顯著。其z值計算公式為 其中 2 如果檢驗來自兩個的兩組樣...
常見統計量
最小值.數值變數的最小值。最大值.數值變數的最大值。總數.所有具有缺失值的測量值的總和或合計。範圍.數值變數的最大值與最小值的差值就是用最大值減最小值後得出的值。平均值.集中趨勢的測量。算術平均值,等於總和除以觀測值數。均值標準誤.取自相同分布中隨樣本不同而變化的均值的值個數的度量值。用於粗略將觀測...
充分統計量
充分統計量不就是在統計量的前面加了乙個充分二字麼,首先它是乙個統計量,所謂的統計量本質就是樣本的函式,即給定一上具體的樣本,就會有乙個統計量這個函式值與之對應。每乙個函式都有特定的意義 統計量這個函式是為了從樣本中得到我們要得到的資訊,比如你可能想知道大家的平均水平,那求個平均值就好了,那麼在實際當...