閒話深度神經網路中的正則化方法之一 Dropout

本文主要聊下inverted dropout。

想看英文解釋的可以檢視《regularization of neural networks using dropconnect》

所謂inverted dropout，當模型使用了dropout layer，訓練的時候只有佔比為 p的隱藏層單元參與訓練，那麼在**的時候，如果所有的隱藏層單元都需要參與進來，則得到的結果相比訓練時平均要大1/p，為了避免這種情況，就需要測試的時候將輸出結果乘以p 使下一層的輸入規模保持不變。而利用inverted dropout，我們可以在訓練的時候直接將dropout後留下的權重擴大1/p倍，這樣就可以使結果的scale保持不變，而在**的時候也不用做額外的操作了，更方便一些。

數學分析：

假設我們設定dropout probability為p, 那麼該層大約有比例為p的單元會被drop掉，因為每個神經元是否drop就是一次伯努利實驗，這層的dropout概率服從伯努利分布，而分布的期望就是np。

,當層有比例為p的單元drop後，大約會變為原來的p倍，為了保證l層的z期望不變，所以要在與dropout矩陣乘積後，要除以p，即擴大1/p倍。

閒話深度神經網路中的正則化方法之一 Dropout

深度神經網路正則化

神經網路正則化方法

深度神經網路正則化（二）dropout正則化

閒話深度神經網路中的正則化方法之一 Dropout

深度神經網路正則化

神經網路正則化方法

深度神經網路 正則化（二）dropout正則化

相關推薦

深度神經網路正則化（二）dropout正則化