特徵歸一化的方法 線性歸一化 零均值歸一化

2022-03-30 10:04:27 字數 487 閱讀 5249

常用歸一化方法

1). 線性歸一化,線性歸一化會把輸入資料都轉換到[0 1]的範圍,公式如下

該方法實現對原始資料的等比例縮放,其中xnorm為歸一化後的資料,x為原始資料,xmax、xmin分別為原始資料集的最大值和最小值。

優點:通過利用變數取值的最大值和最小值將原始資料轉換為界於某一特定範圍的資料,從 而消除量綱和數量級的影響

缺點:由於極值化方法在對變數無量綱化過程中僅僅與該變數的最大值和最小值這兩個極端 值有關,而與其他取值無關,這使得該方法在改變各變數權重時過分依賴兩個極端取值。 零均值歸一化:

2). 0均值標準化,0均值歸一化方法將原始資料集歸一化為均值為0、方差1的資料集,歸一化公式如下:

其中,μ、σ分別為原始資料集的均值和方法。該種歸一化方式要求原始資料的分布可以近似為高斯分布,否則歸一化的效果會變得很糟糕。

優點:去量綱化

缺點:這種歸一化方式要求原始資料的分布可以近似為高斯分布,否則歸一化的效果會變得 很糟糕。

特徵歸一化

我們在衡量一些事物時,我們總是不能同等程度的看待各個特徵,無法對這個事物做出準確的衡量,即我們沒有將各個特徵量化到統一的區間。為了解決這樣的問題,我們引出了特徵歸一化 目錄 特徵歸一化的概念 特徵歸一化必要性 資料標準化的意義 資料標準化的方法 資料的標準化 normalization 是將資料按比...

特徵歸一化優點

資料的標準化 normalization 是將資料按比例縮放,使之落入乙個小的特定區間。在某些比較和評價的指標處理中經常會用到,去除資料的單位限制,將其轉化為無量綱的純數值,便於不同單位或量級的指標能夠進行比較和加權其中最典型的就是資料的歸一化處理,即將資料統一對映到 0,1 區間上。1 提公升收斂...

特徵向量的歸一化方法

在使用knn k nearest neighbours 根據特徵值進行分類的時候,如果所有變數位於同一值域範圍內,利用這些變數一次性算出距離值是有意義的。不過,假設我們引入乙個對最終的分類結果產生影響的新變數 不同型別的變數 heterogenous varibales 與我們目前使用過的變數不同 ...