動態環境下的slam問題如何解決?

2021-09-27 08:03:52 字數 2084 閱讀 6741

嘿嘿謝邀~~這個問題還是挺感興趣的, 正好早起看到答一發.

於是回答第二第三個問題, 其實必須要進行跟蹤, 如果僅僅給出兩幀, 即使是人自己也是很難區分是否動態物體的, 何況是電腦? 跟蹤的意義在於, 對於場景中的多個物體進行運動估計, 加上對自身運動已知, 就可以推測哪些物體在做絕對運動, 哪些在做相對運動, 哪些靜止不動.

資料關聯的問題在現在比較火爆的幾個monocular slam的工作中都沒有明確指出, 但實際上卻是slam中的最關鍵問題, 在computer vision領域這個問題又叫做corresponding問題, 即特徵匹配.

回想我們當前的特徵匹配策略, 主要是測量兩個特徵descriptor之間的相似程度. 具體做法是, 在兩個連續影象幀中提取所有可以提取的特徵點, 然後逐一比對. 如果足夠相似, 就認為兩個特徵點是同乙個. 事實證明這樣做是遠遠不夠的, 因為影象特徵的區域性性, 在影象中的重複性, 會造成大量的誤匹配. 當然我們有很多奇技淫巧, 比如1nn/2nn, ransac等方法, 但問題並不算被解決, 只能算是被改善了一些吧.

既然提到了, 那就順便講講資料關聯吧.

回到最基本的資料關聯問題上. 在做物體跟蹤的時候, 我們是可以根據物體之前的運動, 估計它在新一幀**現的位置的, 如下圖中藍色的正方形和三角形. 問題在於這個估計值是有一定不確定度的, 就是在圓圈範圍內都是有可能的, 並不一定在藍色圖形處. 於是假如此時我們有5個observation, 對於o1, o2, o5都沒什麼問題, 直接關聯給track1, track2就好了, 但是對於o3, o4就有問題了, 沒辦法確定應該把它們關聯給哪個track, 因為給誰都有可能是對的.

此時就要使用上概率**. 注意這時候還有一種可能性是o2,o3其實是假觀測, 就是它根本不屬於任何乙個track, 這在現實情況中是有可能發生的, 假設這種情況發生的概率是\beta. 假設任意觀察到乙個目標的概率是pd, 把目標i關聯到track j上的概率是g_.

於是對剛剛的o3, o4有十種可能的關聯方式, 對每一種可以算出乙個likelihood出來. 然後選擇likelihood最大的為最終關聯就好了. 這樣做充分地考慮了不確定性的問題, 比起之前ransac亂試智慧型多了.

總而言之, 資料關聯問題至關重要, 看看大牛frank dellaert的phd**吧, 整個工作就是在做data association的.

--------------------------

回到動態場景的問題下來, 剛剛說的是理論的, 吹吹牛吧. 動態場景在語義地圖下當然就好辦很多啦哈哈. 我們如果能識別出點雲中的物體, 至少就可以知道它是否能動, 然後再去判斷它是否真的在動. 語義地圖的工作應該有很多團隊在進行了, 尤其在dl,cv橫行, vision slam當道的大環境下, 語義的引入應該很快會完成吧. 個人對這方面保持持續關注, **就是做的object level slam方面的, 歡迎各位大俠拍磚交流!

--------------------------------

如何解決WINE環境中文顯示問題

wine 為我們提供了乙個可以在linux上使用windows程式的途徑。但是中文顯示卻總是出現方塊或者亂碼。怎麼解決呢?google 搜尋或到 windows xp 的 fonts 目錄下,把 simsun.ttc 即宋體 複製到 wine drive c windows fonts下。推薦使用m...

如何解決ubuntu下pdf亂碼的問題

安轉ubuntu有一段時間了,也遇到了一些問題。現在就ubuntu下出現pdf亂碼的問題解決辦法彙總下。第一種辦法 引用 sudo apt get install xpdf xpdf chinese simplified 反正我用這個的時候沒用 第二種辦法 引用 sudo apt get insta...

如何解決mysql stop fail的問題

最近在學習mysql,碰到了乙個mysql stop fail的問題,在這裡把碰到的問題以及解決的過程寫出來,不是這個問題有多難,而是我在解決此問題的過程中沒有發現乙個行之有效的解決問題的中文網頁,搞得白白浪費了很多時間。在這裡我把解決的過程寫下來,希望給後來者解決相同的問題節省點時間。好了,廢話不...