卷積神經網路本身的設計對旋轉不變性沒有進行專門的考慮,只不過max-pooling可以稍微補償一下這個功能,只是角度變化太大,可能會作用不大,但因為max-pooling並不是為此而設計的,所以總體上說cnn提取旋轉不變的特徵能力是比較弱的。
**group equivariant convolutional networks和spherical cnns對網路結構的旋轉不變性設計進行了理論分析,其中提出了群論的思想。那麼,引入群論有什麼作用呢?群有乙個性質,如果兩個群滿足雙射的條件,也即存在乙個變換,可以讓兩個群的元素一一對應,那麼就稱這兩個群是同構的。原文中的同構特指等距同構。等距同構是指在度量空間之間保持距離關係的同構。在幾何學中對應全等變換。同構的群具有一樣的群性質,研究其中任何乙個群得到的結論可以適用於與其同構的群。根據本文的理解,作者的意思是將輸入的旋轉或者鏡面翻轉的影象看成是對原圖進行操作,對應乙個群,要找到另乙個群對卷積核進行操作,得到的結果須跟原圖原卷積核處理得到的結果一樣,也就是等變性。這裡同構指的是對原圖進行操作的群和對核,或者按照原文的說法,對影象所在空間進行操作的群滿足一一對應的關係,並且均滿足對稱群的條件。既然群性質一樣,那麼就可以通過分析對核操作的群來間接分析對原圖進行操作的群,獲取變換後的影象資訊。
後續對這兩篇**進行分析。
深度學習 卷積神經網路為什麼具有平移不變性?
什麼是平移不變性?不變性不變性意味著即使目標的外觀發生了某種變化,但是你依然可以把它識別出來。這對影象分類來說是一種很好的特性,因為我們希望影象中目標無論是被平移,被旋轉,還是被縮放,甚至是不同的光照條件 視角,都可以被成功地識別出來。所以上面的描述就對應著各種不變性 平移不變性 平移同變性 在歐幾...
特徵提取之旋轉不變性和尺度不變性的通俗理解
特徵匹配 feature match 是計算機視覺中很多應用的基礎,比如說影象配準,攝像機跟蹤,三維重建,物體識別,人臉識別,所以花一些時間去深入理解這個概念是不為過的。本文希望通過一種通俗易懂的方式來闡述特徵匹配這個過程,以及在過程中遇到的一些問題。首先我通過幾張來指出什麼是特徵匹配,以及特徵匹配...
卷積神經網路的理解
cnn中減少引數的2兩個規則 1 區域性感知。生物學中,視覺皮層的神經元是區域性感知資訊的,只響應某些特定區域的刺激 影象的空間聯絡中,區域性的畫素聯絡較為緊密,距離較遠的畫素相關性較弱。這個對應於演算法中卷積核的大小,mnist手寫識別在28 28的畫素中取patch為5 5。上圖中 左邊是全連線...