常用歸一化方法

2021-08-20 21:02:46 字數 894 閱讀 6372

本文**:感謝原作者的付出和分享

在機器學習中領域中的資料分析之前,通常需要將資料標準化,利用標準化後得資料進行資料分析。不同評價指標往往具有

不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料

標準化處

理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜

合對比評價。

contents

1. 歸一化的定義

2. 常用歸一化方法

1. 歸一化的定義

歸一化用一句話說就是:把資料經過處理後使之限定在一定的範圍內。比如通常限制在區間[0, 1]或者[-1, 1]

等等。那麼為什麼要進行歸一化呢? 那麼首先要說到乙個重要的概念,即奇異樣本資料。所謂奇異樣本資料資料

指的是相對於

其他輸入樣本特別大或特別小的樣本向量。舉個例子,比如下面的兩個特徵樣本資料

上面第五列的資料相對於其它的列的資料就是奇異樣本資料,奇異樣本資料的存在會引起訓練時間增大,並可能引

起無法收斂。所以在存在奇異樣本資料的情況下,進行訓練之前最好進行歸一化,如果不存在奇異樣本資料,則可

以不用歸一化。

2. 常用歸一化方法

常用歸一化方法有最大-最小標準化,z-score標準化,函式轉化等等。

(1)最大-最小標準化

最大-最小標準化是對原始資料進行線性變換,設

乙個原始值

(2)z-score標準化

z-score標準化是基於原始資料的均值和標準差進行的資料標準化。將屬性

準化成情況。

其中z-score標準化得到的結果是所有資料都聚集在0附近,方差為1。

還有一些歸一化方法,如對數函式轉換,反餘切函式轉換等方法用的不多,暫時就不講了。

歸一化方法

1 min max標準化 2 z score標準化方法 定義 也稱為離差標準化,是對原始資料的線性變換,使得結果對映到0 1之間。本質 把數變為 0,1 之間的小數。轉換函式 x min max min 如果想要將資料對映到 1,1,則將公式換成 x mean max min 其中 max為樣本資料...

資料歸一化 兩種常用的歸一化方法

資料歸一化 不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料歸一化處理,以解決資料指標之間的可比性。原始資料經過資料歸一化處理後,各指標處於同一數量級,適合進行綜合對比評價。兩種常用的歸一化方法如下 一 min max標準化 min...

資料歸一化和兩種常用的歸一化方法

資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...