歸一化與標準化詳解

2021-07-26 03:49:16 字數 668 閱讀 3132

歸一化(normalization)

1.把資料變為(0,1)之間的小數。主要是為了方便資料處理,因為將資料對映到0~1範圍之內,可以使處理過程更加便捷、快速。

2.把有量綱表示式變換為無量綱表示式,成為純量。經過歸一化處理的資料,處於同一數量級,可以消除指標之間的量綱和量綱單位的影響,提高不同資料指標之間的可比性。

主要演算法:

1.線性轉換,即min-max歸一化(常用方法)

y=(x-min)/(max-min)

2. 對數函式轉換

y=log10(x)

3.反餘切函式轉換

y=atan(x)*2/pi

標準化(standardization)

資料的標準化是將資料按比例縮放,使之落入乙個小的特定區間。

主要方法:

1.z-score標準化,即零-均值標準化(常用方法)

y=(x-μ)/σ

是一種統計的處理,基於正態分佈的假設,將資料變換為均值為0、標準差為1的標準正態分佈。但即使資料不服從正態分佈,也可以用此法。特別適用於資料的最大值和最小值未知,或存在孤立點。

2.小數定標標準化

y=x/10^j (j確保max(|y|)<1)

通過移動x的小數字置進行標準化

3.對數logistic模式

y=1/(1+e^(-x))

歸一化與標準化

特點 對不同特徵維度的伸縮錶換的目的是使各個特徵維度對目標函式的影響權重是一致的,即使得那些扁平分布的資料伸縮變換成類圓形。這也就改變了原始資料的乙個分布。好處 1 提高迭代求解的收斂速度 2 提高迭代求解的精度 方法 1 min max標準化 也成為離差標準化,對原始資料的的線性變換,結果值對映到...

歸一化與標準化

1 提公升訓練的速度 2 提公升模型的精度 3 深度模型中能夠防止梯度 min max 歸一化 x x x min x max x min 將x 對映到 0,1 之間的乙個數 z score 標準化 均值為0 標準差為1 當有新的樣本加入時,min max 計算量小,z score 需要重新計算均值...

歸一化與標準化區別

常用的方法是通過對原始資料進行線性變換把資料對映到 0,1 之間,變換函式為 不同變數往往量綱不同,歸一化可以消除量綱對最終結果的影響,使不同變數具有可比性。在不涉及距離度量 協方差計算 資料不符合正太分布的時候,可以使用歸一化方法。比如影象處理中,將rgb影象轉換為灰度影象後將其值限定在 0 25...