r語言熵權法求權重(真實案例完整流程)

2021-08-13 04:06:59 字數 3188 閱讀 8097

在資訊理論中,熵是對不確定性的一種度量。資訊量越大,不確定性就越小,熵也就越小;資訊量越小,不確定性越大,熵也越大。

根據熵的特性,可以通過計算熵值來判斷乙個事件的隨機性及無序程度,也可以用熵值來判斷某個指標的離散程度,指標的離散程度越大,該指針對綜合評價的影響(權重)越大。比如樣本資料在某指標下取值都相等,則該指針對總體評價的影響為0,權值為0.

熵權法是一種客觀賦權法,因為它僅依賴於資料本身的離散性。

第一步:指標的歸一化處理(異質指標同質化):由於各項指標的計量單位並不統一,因此在用他們計算綜合指標前,先要進行標準化處理,即把指標的絕對值轉化為相對值,從而解決各項不同質指標值的同質化問題。

另外,正向指標和負向指標數值代表的含義不同(正向指標數值越高越好,負向指標數值越低越好),因此,對於正向、負向指標需要採用不同的演算法進行資料標準化處理。

正向指標:xij

′=xi

j−min⁡

max⁡

−min

⁡x_^=\frac-\min \left\, \ldots, x_\right\}}, \ldots, x_\right\}-\min \left\, \ldots, x_\right\}}

xij′​=

max−

minxij

​−min​

負向指標:xij

′=max⁡−x

ijmax⁡

−min

⁡x_^=\frac, \ldots, x_\right\}-x_}, \ldots, x_\right\}-\min \left\, \ldots, x_\right\}}

xij′​=

max−

minmax−x

ij​​

第二步:計算第j項指標下第i個樣本值佔該指標的比重pij

=xij

∑i=1

nxij

,i=1

,⋯,n

,j=1

,⋯,m

p_=\frac}^ x_}, \quad i=1, \cdots, n, j=1, \cdots, m

pij​=∑

i=1n

​xij

​xij

​​,i

=1,⋯

,n,j

=1,⋯

,m第三步:計算第j項指標的熵值ej=

−k∑i

=1np

ijln⁡

(pij

),j=

1,⋯,

me_=-k \sum_^ p_ \ln \left(p_\right), \quad j=1, \cdots, m

ej​=−k

i=1∑

n​pi

j​ln(

pij​

),j=

1,⋯,

m 其中 k=1

/ln⁡(

n)>

0k=1 / \ln (n)>0

k=1/ln(

n)>

0 ,滿足 ej≥

0e_ \geq 0

ej​≥0。

第四步:計算資訊熵冗餘度(差異)dj=

1−ej

,j=1

,⋯,m

d_=1-e_, \quad j=1, \cdots, m

dj​=1−

ej​,

j=1,

⋯,m第五步:計算各項指標的權重wj=

dj∑j

=1md

j,j=

1,⋯,

mw_=\frac}^ d_}, \quad j=1, \cdots, m

wj​=∑j

=1m​

dj​d

j​​,

j=1,

⋯,m第六步:計算各樣本的綜合得分si=

∑j=1

mwjx

ij,i

=1,⋯

,ns_=\sum_^ w_ x_, \quad i=1, \cdots, n

si​=j=

1∑m​

wj​x

ij​,

i=1,

⋯,n 其中, xij

x_xi

j​為標準化後的資料。

資料讀入。

library(forecast)

library(xlconnect)

sourui

部分資料展現

索引列刪除

sourui$案例
第一步:歸一化處理。

min.max.norm 

max.min.norm

sourui_t

第二步:求出所有樣本對指標xj的貢獻總量

first1 

第三步:將上步生成的矩陣每個元素變成每個元素與該ln(元素)的積並計算資訊熵。

first2 

else

} return(x)

}k d

第四步:計算冗餘度。

d
第五步:計算各項指標的權重。

w 

w

最終輸出結果展現,輸出的為各項指標的權重得分

應用:基於各指標及權重值,可以對每個樣本計算線性得分(使用歸一化後資料)

實現:

sourui$評分

嫡權法賦權法 1 熵值法賦權

一 基本原理 在資訊理論中,熵是對不確定性的一種度量。資訊量越大,不確定性就越小,熵也就越小 資訊量越小,不確定性越大,熵也越大。根據熵的特性,可以通過計算熵值來判斷乙個事件的隨機性及無序程度,也可以用熵值來判斷某個指標的離散程度,指標的離散程度越大,該指針對綜合評價的影響 權重 越大,其熵值越小。...

熵權法確定權重

總結 sparksql實現 m 專案的個數,比如 該月該使用者 了多少種節目 分步計算 在資訊理論中,熵是對不確定性的一種度量。不確定性越大,熵就越大,包含的資訊量越大 不確定性越小,熵就越小,包含的資訊量就越小。根據熵的特性,可以通過計算熵值來判斷乙個事件的隨機性及無序程度,也可以用熵值來判斷某個...

數模演算法 熵權法(用於客觀確定權值)

根據資訊熵的定義,對於某項指標,可以用熵值來判斷某個指標的離散程度,其熵值越小,指標的離散程度越大,該指針對綜合評價的影響 即權重 就越大,如果某項指標的值全部相等,則該指標在綜合評價中不起作用。按照資訊理論基本原理的解釋,資訊是系統有序程度的乙個度量,熵是系統無序程度的乙個度量 如果指標的資訊熵越...