深度學習中的白化預處理

資料的白化是在資料歸一化之後進行的。在對資料進行白化前要求先對資料進行特徵零均值化，不過一般只要做了特徵標準化，那麼這個條件就滿足了。在資料白化過程中，最主要的還是引數epsilon的選擇，因為這個引數的選擇對deep learning的結果起著至關重要的作用。

在基於重構的模型中（比如說常見的rbm，sparse coding, autoencoder都屬於這一類，因為他們基本上都是重構輸入資料），通常是選擇乙個適當的epsilon值使得能夠對輸入資料進行低通濾波。但是何謂適當的epsilon呢？這還是很難掌握的，因為epsilon太小，則起不到過濾效果，會引入很多雜訊，而且基於重構的模型又要去擬合這些雜訊；epsilon太大，則又對元素資料有過大的模糊。因此一般的方法是畫出變化後資料的特徵值分布圖，如果那些小的特徵值基本都接近0，則此時的epsilon是比較合理的。如下圖所示，讓那個長長的尾巴接近於x軸。該圖的橫座標表示的是第幾個特徵值，因為已經將資料集的特徵值從大到小排序過。

如果資料已被縮放到合理範圍(如[0,1])，可以從epsilon = 0.01或epsilon = 0.1開始調節epsilon。

基於正交化的ica模型中，應該保持引數epsilon盡量小，因為這類模型需要對學習到的特徵做正交化，以解除不同維度之間的相關性。

深度學習中的白化預處理

深度學習白化

資料的預處理是深度學習的關鍵

C 中的深度學習（二）預處理識別硬幣的資料集

深度學習中的白化預處理

深度學習 白化

資料的預處理是深度學習的關鍵

C 中的深度學習（二） 預處理識別硬幣的資料集

相關推薦

深度學習白化

C 中的深度學習（二）預處理識別硬幣的資料集