資料歸一化 兩種常用的歸一化方法

2021-10-16 11:55:49 字數 807 閱讀 5086

資料歸一化:不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料歸一化處理,以解決資料指標之間的可比性。原始資料經過資料歸一化處理後,各指標處於同一數量級,適合進行綜合對比評價。兩種常用的歸一化方法如下:

一、min-max標準化(min-max normalization)

原始資料的線性變換,使結果值對映到[0 - 1]之間。轉換函式如下:

x ∗=

x−mi

nmax

−min

x^*=\frac

x∗=max

−min

x−mi

n​其中,max

maxma

x為樣本資料的最大值,min

minmi

n為樣本資料的最小值。這種方法的缺陷就是當有新資料加入時,可能導致max

maxma

x和mi

nmin

min的變化,需要重新定義;

二、z-score標準化方法

這種方法給予原始資料的均值(mean)和標準差(standard deviation)進行資料的標準化。經過處理的資料符合標準正態分佈,即均值為0,標準差為1,轉化函式為:

x ∗=

x−uσ

x^*=\frac

x∗=σx−

u​其中u

uu為所有樣本資料的均值,σ

\sigma

σ為所有樣本資料的標準差。

參考文獻

資料歸一化和兩種常用的歸一化方法

資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...

資料歸一化和兩種常用的歸一化方法

資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...

資料歸一化和兩種常用的歸一化方法

資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...