歸一化方式 標準化

2021-10-02 00:14:56 字數 796 閱讀 3616

歸一化後有兩個好處:

(1)歸一化後加快了梯度下降求最優解的速度。

(2)歸一化有可能提高精度(歸一化是讓不同維度之間的特徵在數值上有一定的比較性)

常見的資料歸一化方法

歸一化(min-max標準化)

標準化(z-score標準化)

歸一化(min-max標準化)

(1)min-max標準化(min-max normalization)(線性函式歸一化)

定義:也稱為離差標準化,是對原始資料的線性變換,使得結果對映到0-1之間。

本質:把數變為【0,1】之間的小數。

轉換函式:(x-min)/(max-min)

如果想要將資料對映到-1,1,則將公式換成:(x-mean)/(max-min)

缺陷:當有新資料加入時,可導致max和min的變化,需要重新定義

對異常值敏感

2)0均值標準化(z-score standardization)

定義:這種方法給與原始資料的均值(mean)和標準差(standard deviation)進行資料的標準化。經過處理的資料符合標準正態分佈,即均值為0,標準差為1.

本質:把有量綱表示式變成無量綱表示式。

轉換函式:(x-mean)/(standard deviation)

其中,mean為所有樣本資料的均值。standard deviation為所有樣本資料的標準差

歸一化和標準化

主要是讀了這篇文章才深入理解這兩個的區別 歸一化 對原始資料進行線性轉換到 0,1 區間,如下 最小值和最大值特別容易受異常值影響,因此魯棒性不好,比較適合傳統的小資料場景 標準化 最常用的方法是z score標準化,即將資料轉化成均值為0,標準差為1,處理方法如下 其中理論解釋 歸一化的依據非常簡...

資料標準化(歸一化)

資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...

標準化 歸一化(二)

答一 歸一化方法 1 把數變為 0,1 之間的小數 主要是為了資料處理方便提出來的,把資料對映到0 1範圍之內處理,更加便捷快速。2 把有量綱表示式變為無量綱表示式 歸一化是一種簡化計算的方式,即將有量綱的表示式,經過變換,化為無量綱的表示式,成為純量。標準化方法 資料的標準化是將資料按比例縮放,使...