2 **三維位姿
3 旋轉對稱物體的位姿估計
這一階段的任務是在影象中識別物體的中心點,分為兩個階段:
將尺寸為512×
\times
× 384的影象分割為128×
\times
× 128大小的影象塊;
將影象塊輸入到vgg分類網路(將最後全連線層的輸出改為16×16
=256
16\times 16=256
16×16=
256)中,得到每個8×
\times
× 8影象塊的分類結果,這裡為二分類,即決定是物體還是背景;
大於設定閾值的8×
\times
× 8影象塊為物體
將包含最大物體區域的影象部分resize為16×16
16\times 16
16×1
6大小,輸入到第二個網路,得到精細化的分割;
網路只有兩個卷積層和兩個池化層,輸出結果同粗分割時類似;
根據精細化分割的結果得到bbox,進而得到物體的中心點。
根據第一階段分割的結果------即影象中感興趣物體的中心點位置,crop出以該點為中心的影象塊輸出到這一階段的網路(同為vgg),輸出為物體在三維場景中3d bbox八個角點在影象上的投影點座標,根據這8組3d-2d的對應點,求解pnp可以得到物體的6d位姿。
bb8在處理旋轉對稱物體的方法很有代表性,下面是本人結合原**對該方法的理解。
原文的3.3小節中詳細地描述了處理對稱物體地方法,我這裡先簡單總結一下:
首先,對於訓練集中的對稱物體,識別它的對稱角度(angle of symmetry),如上圖(a)中所以物體如果忽略圓環上小的突出,可以簡單 理解為乙個對稱角度為180°的物體(也即保持相機的拍攝位姿不變,物體圍繞它自己座標系的對稱軸旋轉180°後拍攝得到的影象和未旋轉前得到的影象非常相似)。
然後,記該物體的對稱角度為α
\alpha
α,物體的旋轉角度為β
\beta
β,則只有限定物體的旋轉角度β∈[
0,α)
\beta \in [0, \alpha)
β∈[0,α
),物體的二維成像與物體的實際位姿才存在一一對應的關係,所以我們需要將訓練集中的標註位姿轉換到一定的範圍,使得在該範圍內拍攝得到的影象滿足上述一一對應的關係。實際上這裡只需要對訓練集中的標註位姿做簡單的3d幾何變換就可以了,下面講一下這個過程。
如上圖所示,假設物體的對稱角度為180°,則我們在固定的緯度拍攝物體製作資料集時,只需要在半個圓弧的範圍內拍攝即可,所以,如果假設原始標註的位姿不在這個半圓弧範圍內,我們就需要沿著該維度的圓形軌跡圍繞對稱軸反向旋轉β
−180
\beta -180
β−18
0°。這個過程只需經過下面的計算即可實現:
[ r′
∣t′]
=[r3
×3∣t
3×1]
[cos
(β%α
)−si
n(β%
α)00
sin(
β%α)
cos(
β%α)
0000
1000
01](1)
\left[ \begin r'&|&t' \end \right]= \left[ \begin r_&|&t_ \end \right] \left[ \begin cos(\beta\%\alpha)&-sin(\beta\%\alpha)&0&0\\ sin(\beta\%\alpha)&cos(\beta\%\alpha)&0&0\\ 0&0&1&0\\ 0&0&0&1 \end \right]\tag
[r′∣
t′]
=[r3
×3
∣t3
×1
]⎣⎢⎢
⎡co
s(β%
α)si
n(β%
α)00
−si
n(β%
α)co
s(β%
α)00
001
000
01⎦
⎥⎥⎤
(1)上式中的%表示求餘數。
第三,通過觀察我們發現,即使物體經過旋轉之後(改變相機的位姿相對來說就是旋轉物體),當它的旋轉角度趨於區間[0,
α)[0, \alpha)
[0,α
) 0,
α/2)
[0, \alpha/2)
[0,α/2
)之間。這一步只需要識別出物體經過上一步處理得到的旋轉角度,如果位於[α/
2,α)
[\alpha/2,\alpha)
[α/2,α
)之間,則將該影象映象處理,輸入模型得到**的關鍵點後在映象回去。
最後,對於迴轉物體(也即對稱角度為0°),式(1)中直接反向旋轉β
\beta
β°。
點雲 相機位姿 什麼是物體6D位姿?
在一些有關物體6d位姿估計或者機械人抓取的 中,我們常會聽到乙個詞 物體6d位姿估計 6d object pose estimation 那什麼是物體的6d位姿呢?它和slam中的相機6d位姿一樣嗎?6d是指6個自由度,代表了3個自由度的位移 也叫平移 translation 以及3個自由度的空間旋...
如何理解物體的6D位姿估計任務?
如何 感性 地理解物體的6d姿態估計任務?答 三維世界中,比如我們開車行駛在道路上,我們不僅需要關注前方是否有車輛,而且更在意前方車輛的狀態,或者說姿態,是正在轉彎,還是正在駛向自己,或是遠離自己。其實這就是乙個物體的6d姿態估計任務。物體就是前方車輛,其在當前時刻,並在我方視角下,它的三維空間位置...
6DoF位姿估計之SSD 6D
4 評價 ssd 6d網路模型的演算法流程為 輸入一張299 times 299的彩色影象到backbone網路 inceptionv4 中,得到6個不同尺度的特徵圖 接著對於每乙個特徵圖,通過3 times 3的滑動視窗得到特徵圖上每個畫素點的分類和回歸結果,分類結果包括c cc種物體類別 取樣得...