1 6 三維卷積

2022-05-28 06:21:11 字數 2544 閱讀 9209

假如說你不僅想檢測灰度影象的特徵,也想檢測 rgb 彩色影象的特徵。彩色影象如果是 6×6×3,這裡的 3指的是三個顏色通道,你可以把它想象成三個 6×6影象的堆疊。為了檢測影象的邊緣或者其他的特徵,不是把它跟原來的 3×3 的過濾器做卷積,而是跟乙個三維的過濾器,它的維度是 3×3×3,這樣這個過濾器也有三層,對應紅綠、藍三個通道。

給這些起個名字(原影象),這裡的第乙個 6 代表影象高度,第二個 6 代表寬度,這個3 代表通道的數目。同樣你的過濾器也有高,寬和通道數,並且影象的通道數必須和過濾器的通道數匹配,所以這兩個數(紫色方框標記的兩個數)必須相等。

這個卷積操作會是乙個 4×4 的影象,注意是 4×4×1,最後乙個數不是 3 了。

這個是 6×6×3 的影象,這個是3×3×3 的過濾器,最後乙個數字通道數必須和過濾器中的通道數相匹配。為了簡化這個 3×3×3過濾器的影象,我們不把它畫成 3 個矩陣的堆疊,而畫成這樣,乙個三維的立方體。

為了計算這個卷積操作的輸出,你要做的就是把這個 3×3×3 的過濾器先放到最左上角的位置,這個 3×3×3 的過濾器有 27 個數, 27 個引數就是 3 的立方。依次取這 27 個數,然後乘以相應的紅綠藍通道中的數字。先取紅色通道的前 9 個數字,然後是綠色通道,然後再是藍色通道,乘以左邊黃色立方體覆蓋的對應的 27 個數,然後把這些數都加起來,就得到了輸出的第乙個數字。

如果要計算下乙個輸出,你把這個立方體滑動乙個單位,再與這 27 個數相乘,把它們都加起來,就得到了下乙個輸出,以此類推。

那麼,這個能幹什麼呢?舉個例子,這個過濾器是 3×3×3 的,如果你想檢測影象紅色通道的邊緣,那麼你可以將第乙個過濾器設為:

而綠色通道全為 0:

藍色也全為 0。如果你把這三個堆疊在一起形成乙個 3×3×3 的過濾器,那麼這就是乙個檢測垂直邊界的過濾器,但只對紅色通道有用。或者如果你不關心垂直邊界在哪個顏色通道裡,那麼你可以用乙個這樣的過濾器:

所有三個通道都是這樣。所以通過設定第二個過濾器引數,你就有了乙個邊界檢測器, 3×3×3 的邊界檢測器,用來檢測任意顏色通道裡的邊界。引數的選擇不同,你就可以得到不同的特徵檢測器,所有的都是 3×3×3 的過濾器。

按照計算機視覺的慣例,當你的輸入有特定的高寬和通道數時, 你的過濾器可以有不同的高,不同的寬,但是必須一樣的通道數。理論上,我們的過濾器只關注紅色通道,或者只關注綠色或者藍色通道也是可行的。

再注意一下這個卷積立方體,乙個 6×6×6 的輸入影象卷積上乙個 3×3×3 的過濾器,得到乙個 4×4 的二維輸出。

如果你想同時用多個過濾器怎麼辦?

這個 6×6×3 的影象和這個 3×3×3 的過濾器卷積,得到 4×4 的輸出。(第乙個)這可能是乙個垂直邊界檢測器或者是學習檢測其他的特徵。第二個過濾器可以用橘色來表示,它可以是乙個水平邊緣檢測器。

所以和第乙個過濾器卷積,可以得到第乙個 4×4 的輸出,然後卷積第二個過濾器,得到乙個不同的 4×4 的輸出。我們做完卷積,然後把這兩個 4×4 的輸出,取第乙個把它放到前面,然後取第二個過濾器輸出,所以把這兩個輸出堆疊在一起,這樣你就都得到了乙個 4×4×2 的輸出立方體。它用 6×6×3 的影象,然後卷積上這兩個不同的 3×3 的過濾器,得到兩個 4×4 的輸出,它們堆疊在一起,形成乙個 4×4×2 的立方體,這裡的 2 的**於我們用了兩個不同的過濾器。

這裡$}}$其實就是下一層的通道數,它就是你用的過濾器的個數,在我們的例子中,那就是 4×4×2。這個假設時用的步幅為 1,並且沒有 padding。如果你用了不同的步幅或者 padding,那麼這個n − f + 1數值會變化。

這個對立方體卷積的概念真的很有用,你現在可以用它的一小部分直接在三個通道的rgb 影象上進行操作。更重要的是,你可以檢測兩個特徵,比如垂直和水平邊緣或者 10 個或者 128 個或者幾百個不同的特徵,並且輸出的通道數會等於你要檢測的特徵數。

三維座標 偏轉 天津三維掃瞄

三維掃瞄的概念及儀器種類 三維掃瞄是指集光 機 電和計算機技術於一體的高新技術,主要用於對物體空間外形和結構及色彩進行掃瞄,以獲得物體表面的空間座標。它的重要意義在於能夠將實物的立體資訊轉換為計算機能直接處理的數碼訊號,為實物數位化提供了相當方便快捷的手段。三維掃瞄技術能實現非接觸測量,且具有速度快...

python三維座標 python中三維輪廓的座標

感謝在這個 上獲得的知識。我能寫乙個簡單的指令碼,列印出等高線圖的座標 x和y 在 下面是乙個例子 from numpy import from pylab import generate a set of random points npts 500 phi random npts 2 pi th...

三維座標 偏轉 三維座標下的旋轉

三維座標的旋轉有以下幾種常見的表示形式 旋轉向量,旋轉矩陣,尤拉角,四元數,下面對這四種表示形式及其之間的轉換進行介紹 旋轉向量 通常為3x1的列向量,向量方向即為旋轉軸,向量的模表示繞軸逆時針旋轉的角度,如旋轉向量v a,b,c 那麼旋轉角度theta sqrt a2 b2 c2 旋轉軸z a t...