歸一化的作用

2021-08-30 06:48:41 字數 986 閱讀 8681

一:定義

標準化是將不同變化範圍的值對映到相同的固定範圍中,常見的是 [0,1],此時亦稱歸一化,也可以是[-1,1]範圍。

二:形式

1.min-max標準化

也稱為離差標準化,是對原始資料的線性變換,使結果值對映到[0 - 1]之間。轉換函式如下:

2.z-score標準化方法

這種方法給予原始資料的均值(mean)和標準差(standard deviation)進行資料的標準化。經過處理的資料符合標準正態分佈,即均值為0,標準差為1,轉化函式為:

三.歸一化作用

1.無量綱化

例如房子數量和收入,從業務層知道這兩者的重要性一樣,所以把它們全部歸一化,這是從業務層面上作的處理。

2.避免數值問題

不同的資料在不同列資料的數量級相差過大的話,計算起來大數的變化會掩蓋掉小數的變化。

3.一些模型求解的需要

例如梯度下降法,如果不歸一化,當學習率較大時,求解過程會呈之字形下降。學習率較小,則會產生直角形路線,不管怎麼樣,都不會是好路線。

4.時間序列

進行log分析時,會將原本絕對化的時間序列歸一化到某個基準時刻,形成相對時間序列,方便排查。

5.收斂速度

加快求解過程中引數的收斂速度。

四:例子

假設有兩個變數,都是均勻分布,x1範圍是[10000,20000],x2範圍是[1,2]。有很多處於同一直線上的點,我們稱這條直線為l。如果現在我們要做乙個分類的話,x2幾乎可以被忽略,x2很無辜的被乾掉了,僅僅因為所謂量綱的問題。即便x2不被乾掉,現在繼續求解,來做梯度下降。 很顯然,如果某一步我們求得的下降方向不在直線l上,幾乎可以肯定肯定這步不會下降。這就會導致不收斂,或者收斂很慢。

歸一化和標準化的作用

2020 04 21 21 52 11 問題描述 為什麼需要對數值型別的特徵做歸一化。問題求解 為了消除資料特徵之間的量綱影響,我們需要對特徵進行歸一化處理,使得不同指標之間具有可比性。舉例來說,比如分析乙個人的身高,體重對健康的影響,乙個人的身高範圍在1m 2m之間,乙個人的體重範圍在50kg 1...

批歸一化作用 深度學習中批歸一化的陷阱

批歸一化技術 batch normalization 是深度學習中最近出現的乙個有效的技術,已經被廣泛證明其有效性,並很快應用於研究和應用中去。這篇文章假設讀者知道什麼是批歸一化,並對批歸一化有一定程度的了解,知道它是如何工作的。如果你是剛剛接觸這個概念,或者需要複習一下,您可以在後面的鏈結位址找到...

特徵歸一化的方法 線性歸一化 零均值歸一化

常用歸一化方法 1 線性歸一化,線性歸一化會把輸入資料都轉換到 0 1 的範圍,公式如下 該方法實現對原始資料的等比例縮放,其中xnorm為歸一化後的資料,x為原始資料,xmax xmin分別為原始資料集的最大值和最小值。優點 通過利用變數取值的最大值和最小值將原始資料轉換為界於某一特定範圍的資料,...