資料歸一化,標準化的幾種方法

2021-09-02 15:18:52 字數 930 閱讀 7893

歸一化方法(normalization method)

1。 把數變為(0,1)之間的小數

主要是為了資料處理方便提出來的,把資料對映到0~1範圍之內處理,更加便捷快速,應該歸到數字訊號處理範疇之內。

2 。把有量綱表示式變為無量綱表示式

歸一化是一種簡化計算的方式,即將有量綱的表示式,經過變換,化為無量綱的表示式,成為純量。

比如,複數阻抗可以歸一化書寫:z = r + jωl = r(1 + jωl/r) ,複數部分變成了純數量了,沒有量綱。

另外,微波之中也就是電路分析、訊號系統、電磁波傳輸等,有很多運算都可以如此處理,既保證了運算的便捷,又能凸現出物理量的本質含義。

標準化方法(normalization method)

資料的標準化是將資料按比例縮放,使之落入乙個小的特定區間。由於信用指標體系的各個指標度量單位是不同的,為了能夠將指標參與評價計算,需要對指標進行規範化處理,通過函式變換將其數值對映到某個數值區間。一般常用的有以下幾種方法。

(1) 最小-最大規範化對原始資料進行線性變換。假定maxa與mina分別表示屬性a的最大與最小值。最小最大規範化通過計算將屬性a的值對映到區間[a, b]上的v。一般來說,將最小-最大規範化在用於信用指標資料上,常用的有以下兩種函式形式:

a) 效益型指標(越大越好型)的隸屬函式:

b) 成本型指標(越小越好型)的隸屬函式:

(2) z-score規範化也稱零-均值規範化。屬性a的值是基於a的平均值與標準差規範化。

(3) 小數定標規範化是通過移動屬性a的小數點位置來實現的。小數點的移動位數依賴於a的最大絕對值。

線性函式轉轉講一系列資料對映到相應區間,例如將所有資料對映到 1~100

可用下列函式

y=((x-min)/(max-min))*(100-1)+1

1-100 範圍內

min是資料集中最小值,max是最大值

資料標準化(歸一化)方法

在現實生活中,乙個目標變數 y 可以認為是由多個特徵變數 x 影響和控制的,那麼這些特徵變數的量綱和數值的量級就會不一樣,比如x1 10000,x2 1,x3 0.5 可以很明顯的看出特徵x1和x2 x3存在量綱的差距 x1對目標變數的影響程度將會比x2 x3對目標變數的影響程度要大 可以這樣認為目...

資料標準化(歸一化)

資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...

資料標準化 歸一化

資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...