資料標準化分為三種:標準化、線性歸一化、非線性歸一化。
歸一化的作用有兩個:第一,加快運算速度。第二,提高計算精度。
一般來說,概率樹結構的演算法不需要進行資料歸一化處理。尋找最優化問題的演算法需要進行資料歸一化處理。
下面總結一下常見的演算法哪些需要進行資料歸一化,哪些不需要。
需要不需要
lr(線性回歸、邏輯回歸)
決策樹svm(支援向量機)
隨機森林
knn樸素貝葉斯
kmeans
xgboost
高斯過程
lightgbm
adaboost
神經網路
lstm
gbdt
資料歸一化總結
近來,在網上搜了很多關於資料歸一化的帖子,看了太多,很雜,這裡整理總結一下 歸一化是一種資料預處理方法,就是要把你需要處理的資料經過處理後 通過某種演算法 限制在你需要的一定範圍內,為了後面資料處理的方便,其次是保正程式執行時 收斂加快 比如說,對於奇異樣本資料 所謂奇異樣本資料資料指的是相對於其他...
BN演算法 批量歸一化演算法
2015年的 batch normalization accelerating deep network training by reducing internal covariate shift 思想 給每層神經網路的輸出做乙個歸一化,將資料變為乙個高斯分布。為增加模型的表達能力,每個神經元都要以...
演算法提高 複數歸一化
演算法提高 複數歸一化 時間限制 1.0s 記憶體限制 512.0mb 編寫函式normalize,將複數歸一化,即若複數為a bi,歸一化結果為a sqrt a a b b i b sqrt a a b b 使用結構體指標型別作為函式引數可能是必要的。其中實部和虛部由鍵盤輸入,輸出為歸一化結果,如...