譯改 BN LN IN GN 詳解

2021-10-03 14:54:58 字數 1707 閱讀 4951

本文主體內容是由牆外翻譯修改而來,對關鍵結論寫下了自己的理解。

batch norm (ioffe & szegedy, 2015)是提出的用於訓練深度神經網路的歸一化的方法,在經驗上是非常成功的。它還引入了「內部協變位移(internal covariate shift)」這一術語,定義為訓練過程中網路引數的變化導致網路活動分布的變化。批處理範數的目標是通過使用小批處理的平均值和方差對每個小批處理的資料進行歸一化,從而減少內部協變數的移位。講白了,就是在每乙個channel的維度(c=1),在樣本n的這一批進行norm,此時,被norm的是 [n,h,w]這個資料塊。比如有16個channel,那麼就要norm 16個 [n,h,w]的資料塊。layer normalization(ba,kiros,&hinton,2016)試**決批處理規範的一些缺點:

尚不清楚如何在rnn中應用批處理規範

批處理規範需要大的batchsize才能準確估算統計資訊

layer normalization不是對整個batch的示例進行標準化,而是對每個示例中的要素進行標準化。講白了就是n=1,在feature maps維度上的這一批進行norm,此時,被norm的是 [c,h,w]這個資料塊。

instance normalization(ulyanov,vedaldi和lempitsky,2023年)在layer normalization之後僅六天就掛到了arxiv,這非常相似。理解了layer normalization,就比較好理解 instance normalization了。instance normalization就是對於乙個[h,w] 的資料塊都進行歸一化。那麼如果有16個channel,batchsize=16,就有256個資料塊需要歸一化。

理解了instance normalization和layer normalization,group normalization就又很好理解了,哈哈哈。下面是group normalization中的一副圖,可以幫助大家理解。gn就是對於某幾個(c//g,c是channel 總數,g是超參)channel的資料塊[c//g,h,w]進行norm。比如16//5=3。那麼gn的特殊情況就是instance normalization和layer normalization了~~

兩個公式一摸一樣,

oracle改字型大小 sqlplus改字型

sqlplus font,其值為 terminal sqlplus font size,其值為14,或其他大小的值,如16 18等。問題3 在sql plus中改變字型和字符集 問題描述 有時,sql plus中顯示的資料字型太小,怎樣改變sql plus中顯示的字型大小?問題分析 oracle中所...

電腦改ip怎麼改

電腦改ip怎麼改?首先右鍵開啟電腦螢幕右下方的網路連線的圖示,選擇開啟網路和共享中心。在網路和共享中心當中點選網路連線連線狀態中的本地連線,可以進入本地連線狀態。在本地連線狀態中點選屬性,進入本地連線的管理狀態。在本地連線屬性當中可以看到兩個協議版本,雙擊它們可以看到更改ip位址和dns的介面。通常...

django verbose name中文解碼出錯

對於執行在python3.x以上django1.6.x版本而言,由於統一使用了unicode,所以中文顯示的問題大大減少。對於以下 如果顯示unicodeerror錯誤 class book models.model title models.charfield verbose name 出版商 m...