深度學習 卷積神經網路為什麼具有平移不變性?

2021-09-22 01:44:07 字數 675 閱讀 2303

什麼是平移不變性?

不變性不變性意味著即使目標的外觀發生了某種變化,但是你依然可以把它識別出來。這對影象分類來說是一種很好的特性,因為我們希望影象中目標無論是被平移,被旋轉,還是被縮放,甚至是不同的光照條件、視角,都可以被成功地識別出來。

所以上面的描述就對應著各種不變性:

平移不變性/平移同變性

在歐幾里得幾何中,平移是一種幾何變換,表示把一幅影象或乙個空間中的每乙個點在相同方向移動相同距離。比如對影象分類任務來說,影象中的目標不管被移動到的哪個位置,得到的結果(標籤)應該是相同的,這就是卷積神經網路中的平移不變性。

平移不變性意味著系統產生完全相同的響應(輸出),不管它的輸入是如何平移的 。平移同變性(translation equivariance)意味著系統在不同位置的工作原理相同,但它的響應隨著目標位置的變化而變化 。比如,例項分割任務,就需要平移同變性,目標如果被平移了,那麼輸出的例項掩碼也應該相應地變化。最近看的fcis這篇文章中提到,乙個畫素在某乙個例項中可能是前景,但是在相鄰的乙個例項中可能就是背景了,也就是說,同乙個畫素在不同的相對位置,具有不同的語義,對應著不同的響應,這說的也是平移同變性。

為什麼卷積神經網路具有平移不變性

簡單地說,卷積+最大池化約等於平移不變性。

所以這兩種操作共同提供了一些平移不變性,即使影象被平移,卷積保證仍然能檢測到它的特徵,池化則盡可能地保持一致的表達。

深度學習 卷積神經網路

一 卷積神經網路基礎 二 lenet 三 常見的一些卷積神經網路 卷積層的超引數 填充和步幅。步幅 stride 每次卷積核在輸入陣列上滑動的行數與列數。多輸入與輸出通道 將3維陣列除寬高外的一維稱為通道維。1 1卷積層 包含1 1的卷積核的卷積層。1 1卷積核在不改變輸入高寬的情況下調整通道數。如...

深度學習 卷積神經網路

卷積神經網路 convolutional neural networks,cnn 是一類包含卷積計算且具有深度結構的前饋神經網路 feedforward neural networks 是深度學習 deep learning 的代表演算法之一。卷積神經網路具有表徵學習 representation ...

深度學習之卷積神經網路

卷積神經網路是一種多層神經網路,擅長處理影象特別是大影象的相關機器學習問題。卷積網路通過一系列方法,成功將資料量龐大的影象識別問題不斷降維,最終使其能夠被訓練。cnn最早由yann lecun提出並應用在手寫字型識別上 minst lecun提出的網路稱為lenet,其網路結構如下 這是乙個最典型的...