在資訊理論中,熵是對不確定性的一種度量。資訊量越大,不確定性就越小,熵也就越小;資訊量越小,不確定性越大,熵也越大。
根據熵的特性,可以通過計算熵值來判斷乙個事件的隨機性及無序程度,也可以用熵值來判斷某個指標的離散程度,指標的離散程度越大,該指針對綜合評價的影響(權重)越大。比如樣本資料在某指標下取值都相等,則該指針對總體評價的影響為0,權值為0.
熵權法是一種客觀賦權法,因為它僅依賴於資料本身的離散性。
第一步:指標的歸一化處理(異質指標同質化):由於各項指標的計量單位並不統一,因此在用他們計算綜合指標前,先要進行標準化處理,即把指標的絕對值轉化為相對值,從而解決各項不同質指標值的同質化問題。
另外,正向指標和負向指標數值代表的含義不同(正向指標數值越高越好,負向指標數值越低越好),因此,對於正向、負向指標需要採用不同的演算法進行資料標準化處理。
正向指標:xij
′=xi
j−min
max
−min
x_^=\frac-\min \left\, \ldots, x_\right\}}, \ldots, x_\right\}-\min \left\, \ldots, x_\right\}}
xij′=
max−
minxij
−min
負向指標:xij
′=max−x
ijmax
−min
x_^=\frac, \ldots, x_\right\}-x_}, \ldots, x_\right\}-\min \left\, \ldots, x_\right\}}
xij′=
max−
minmax−x
ij
第二步:計算第j項指標下第i個樣本值佔該指標的比重pij
=xij
∑i=1
nxij
,i=1
,⋯,n
,j=1
,⋯,m
p_=\frac}^ x_}, \quad i=1, \cdots, n, j=1, \cdots, m
pij=∑
i=1n
xij
xij
,i
=1,⋯
,n,j
=1,⋯
,m第三步:計算第j項指標的熵值ej=
−k∑i
=1np
ijln
(pij
),j=
1,⋯,
me_=-k \sum_^ p_ \ln \left(p_\right), \quad j=1, \cdots, m
ej=−k
i=1∑
npi
jln(
pij
),j=
1,⋯,
m 其中 k=1
/ln(
n)>
0k=1 / \ln (n)>0
k=1/ln(
n)>
0 ,滿足 ej≥
0e_ \geq 0
ej≥0。
第四步:計算資訊熵冗餘度(差異)dj=
1−ej
,j=1
,⋯,m
d_=1-e_, \quad j=1, \cdots, m
dj=1−
ej,
j=1,
⋯,m第五步:計算各項指標的權重wj=
dj∑j
=1md
j,j=
1,⋯,
mw_=\frac}^ d_}, \quad j=1, \cdots, m
wj=∑j
=1m
djd
j,
j=1,
⋯,m第六步:計算各樣本的綜合得分si=
∑j=1
mwjx
ij,i
=1,⋯
,ns_=\sum_^ w_ x_, \quad i=1, \cdots, n
si=j=
1∑m
wjx
ij,
i=1,
⋯,n 其中, xij
x_xi
j為標準化後的資料。
資料讀入。
library(forecast)
library(xlconnect)
sourui
部分資料展現
索引列刪除
sourui$案例
第一步:歸一化處理。
min.max.norm
max.min.norm
sourui_t
第二步:求出所有樣本對指標xj的貢獻總量
first1
第三步:將上步生成的矩陣每個元素變成每個元素與該ln(元素)的積並計算資訊熵。
first2
else
} return(x)
}k d
第四步:計算冗餘度。
d
第五步:計算各項指標的權重。
w
w
最終輸出結果展現,輸出的為各項指標的權重得分
應用:基於各指標及權重值,可以對每個樣本計算線性得分(使用歸一化後資料)
實現:
sourui$評分
嫡權法賦權法 1 熵值法賦權
一 基本原理 在資訊理論中,熵是對不確定性的一種度量。資訊量越大,不確定性就越小,熵也就越小 資訊量越小,不確定性越大,熵也越大。根據熵的特性,可以通過計算熵值來判斷乙個事件的隨機性及無序程度,也可以用熵值來判斷某個指標的離散程度,指標的離散程度越大,該指針對綜合評價的影響 權重 越大,其熵值越小。...
熵權法確定權重
總結 sparksql實現 m 專案的個數,比如 該月該使用者 了多少種節目 分步計算 在資訊理論中,熵是對不確定性的一種度量。不確定性越大,熵就越大,包含的資訊量越大 不確定性越小,熵就越小,包含的資訊量就越小。根據熵的特性,可以通過計算熵值來判斷乙個事件的隨機性及無序程度,也可以用熵值來判斷某個...
數模演算法 熵權法(用於客觀確定權值)
根據資訊熵的定義,對於某項指標,可以用熵值來判斷某個指標的離散程度,其熵值越小,指標的離散程度越大,該指針對綜合評價的影響 即權重 就越大,如果某項指標的值全部相等,則該指標在綜合評價中不起作用。按照資訊理論基本原理的解釋,資訊是系統有序程度的乙個度量,熵是系統無序程度的乙個度量 如果指標的資訊熵越...