1 什麼是歸一化,它與標準化的區別是什麼

2021-10-04 11:55:18 字數 808 閱讀 8608

不同點

對比點歸一化

標準化概念

將數值規約到(0,1)或(-1,1)區間

將對應資料的分布規約在均值為0,標準差為1的分布上

側重點數值的歸一,丟失資料的分布資訊,對資料之間的距離沒有得到較好的保留,但保留了權重

資料分布的歸一,較好的保留了資料之間的分布,也即保留了樣本之間的距離,但丟失了權值

形式缺點1.丟失樣本間的距離資訊;2.魯棒性較差,當有新的樣本加入時最大值與最小值很容易受異常點影響

1.丟失樣本間的權重資訊;

適合場景

1.小資料/固定資料的使用;2.不涉及距離度量、協方差計算、資料不符合正態分佈的時候;3.進行多指標綜合評價的時候;

1.在分類、聚類演算法中,需要使用距離來度量相似性;2.有較好的魯棒性,有產出取值範圍的離散資料或對最大值最小值未知的情況下;

縮放方式

先使用最小值平移,後使用最值差縮放

先使用均值u平移,之後用標準差進行縮放

目的便於消除量綱,將各個指標的資料納入到綜合評價中;

便於後續的梯度下降和啟用函式對資料的處理。因為標準化後,資料以0為中心左右分布,而函式sigmoid,tanh,softmax等也都以0為中心左右分布;

相同點及其聯絡

聯絡:歸一化廣義上是包含標準化的,以上主要是從狹義上區分兩者。

本質上都是進行特徵提取,方便最終資料的比較。

都是為了縮小範圍,便於後續的資料處理。

作用:加快梯度下降,損失函式收斂; 提公升模型精度; 防止梯度**(消除因為輸入差距過大而帶來的輸出差距過大,進而在反向傳播的過程當中導致梯度過大,從而形成梯度**)

歸一化和標準化區別

歸一化 對資料的數值範圍進行特定縮放,但不改變其資料分布的一種線性特徵變換。1.min max 歸一化 將數值範圍縮放到 0,1 但沒有改變資料分布 min max歸一化 2.z score 歸一化 將數值範圍縮放到0附近,但沒有改變資料分布 z score歸一化 標準化 對資料的分布的進行轉換,使...

歸一化與標準化區別

常用的方法是通過對原始資料進行線性變換把資料對映到 0,1 之間,變換函式為 不同變數往往量綱不同,歸一化可以消除量綱對最終結果的影響,使不同變數具有可比性。在不涉及距離度量 協方差計算 資料不符合正太分布的時候,可以使用歸一化方法。比如影象處理中,將rgb影象轉換為灰度影象後將其值限定在 0 25...

標準化與歸一化的區別?

答 簡單來說,標準化是依照特徵矩陣的列處理資料,其通過求z score的方法,將樣本的特徵值轉換到同一量綱下。歸一化是依照特徵矩陣的行處理資料,其目的在於樣本向量在點乘運算或其他核函式計算相似性時,擁有統一的標準,也就是說都轉化為 單位向量 歸一化 這種方法有個缺陷就是當有新資料加入時,可能導致ma...