中心化和標準化

2021-08-20 23:00:30 字數 416 閱讀 4418

′=

x−μσ

x′=x−μσ

原因:在一些實際問題中,我們得到的樣本資料都是多個維度的,即乙個樣本是用多個特徵來表徵的。很顯然,這些特徵的量綱和數值得量級都是不一樣的,而通過標準化處理,可以使得不同的特徵具有相同的尺度(scale)。這樣,在學習引數的時候,不同特徵對引數的影響程度就一樣了。簡言之,當原始資料不同維度上的特徵的尺度(單位)不一致時,需要標準化步驟對資料進行預處理。

中間的是中心化後的資料,可以看出就是乙個平移的過程,平移後中心點是(0,0)。同時中心化後的資料對向量也容易描述,因為是以原點為基準的。

右圖將中心化後的資料除以標準差,得到為標準化的資料,可以看出每個維度上的尺度是一致的(紅色線段的長度表示尺度),而沒有處理之前的資料是不同的尺度標準。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。

樣本中心化 標準化

在回歸問題和一些機器學習演算法中,以及訓練神經網路的過程中,通常需要對原始資料進行中心化 zero centered或者mean subtraction 處理和標準化 standardization或normalization 處理。目的 通過中心化和標準化處理,得到均值為0,標準差為1的服從標準正...

歸一化 標準化 中心化

歸一化 把資料變成 0,1 或 1,1 之間的小數。主要是為了資料處理方便提出來的,把資料對映到0 1範圍之內處理,更加便捷快速。是一種簡化計算的方式,將有量綱的表示式,經過變換,化為無量綱的表示式,成為標量,便於不同單位或量級的指標能夠進行比較和加權。標準化 在機器學習中,我們可能要處理不同種類的...

資料預處理 中心化和標準化

一 中心化 又叫零均值化 和標準化 又叫歸一化 概念及目的?1 在回歸問題和一些機器學習演算法中,以及訓練神經網路的過程中,通常需要對原始資料進行中心化 zero centered或者mean subtraction subtraction表示減去 處理和標準化 standardization或no...