資料標準化的幾種方法:
1.標準化:
資料標準化是指資料的各維度減均值除以標準差,這是最常用的標準化方法。
公式:(xi−
μσ'>xi
−μ)/σ 其中μ指的是樣本的均值,σ指的是樣本的標準差。xi
−μσ'>2.歸一化:xi
−μσ'>資料歸一化是指資料減去對應維度的最小值除以維度最大值減去維度最小值,這樣做可以將數值壓縮到[0,1]的區間。xi
−μσ'>公式:(xi
−min(x))/(max(x)−min(x))xi
−μσ'>3.白化:
白化的目的是去除輸入資料的冗餘資訊。
白化演算法的實現過程:第一步操作是pca,求出新特徵空間中的新座標,第二步是對新的座標進行方差歸一化操作。
pca預處理:
左圖表示原始資料x,然後我們通過協方差矩陣可以求得特徵向量u1、u2,然後把每個資料點,投影到這兩個新的特徵向量(這兩個特徵向量是不變且正交的),得到進行座標如下:
這就是pca處理。
pca白化
pca白化是指對上面的pca的新座標x』,每一維的特徵做乙個標準差歸一化處理。
從上面我們看到在新的座標空間中,(x1,x2)兩個座標軸方向的資料明顯標準差不同,因此我們接著要對新的每一維座標做乙個標註差歸一化處理。
深度學習批標準化
傳統機器學習中標準化也叫做歸一化,一般是將資料對映到指定的範圍,用於去除不同維度資料的量綱以及量綱單位。資料標準化讓機器學習模型看到的不同樣本彼此之間更加相似,這有助於模型的學習與對新資料的泛化。常見的資料標準化形式 標準化和歸一化,將資料減去其平均值使其中心為 0,然後將資料除以其標準差使其標準差...
資料標準化(歸一化)
資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...
資料標準化 歸一化
資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...