語義SLAM的資料關聯和語義定位(一)

2022-05-07 17:09:07 字數 1436 閱讀 9681

語義slam和多感測器融合是自動駕駛建圖和定位部分比較熱門的兩種技術。語義slam中,語義資訊的資料關聯相較於特徵點的資料關聯有所不同。我們一般用特徵描述子的相似性來匹配和關聯不同影象中的特徵點。特徵點的描述子會受到光照、視角和感測器的影響,不太適用於大尺度長週期的任務,比如自動駕駛的高精度地圖。得益於深度學習的快速發展,這些影響因素對於目標識別、語義分割來說已經不是最本質的困難,因此語義資訊在高精度地圖中越來越受重視。

在slam中,語義資訊的資料關仍然是乙個值得研究的問題。這個問題的關鍵在於,一幅影象中可能檢測出數個相同類別的目標物體,如何能夠正確地將其對應於地圖資料中已有的該類別的3d物體。

在語義slam中,雖然語義目標同樣可以產生某種描述子(比如深度網路中的某些層),但對於相同類別且距離較近的目標,我們可能無法確定合理的對應關係。考慮到影象中的目標(10個左右)並不如特徵點那樣豐富(1000個左右),錯誤的匹配並不方便通過ransac演算法來排除(樣本不足)。

下面列出幾種有用的因素。

利用第一點,我們能夠使用一些簡單的方法建立資料關聯,但此時仍需考慮錯誤關聯的影響。

利用第二點,我們能夠準確地重建出語義目標的幾何特性(空間位置、朝向等)。x-view: graph-based semantic multi-view localization這篇文章將多幀的語義目標位置組合成圖,利用圖匹配演算法求解相機在全域性地圖中的位置(只定位不建圖)。

利用第三點,我們能夠方便地確定關聯關係。比如,行車道上的交通指示牌結合文字ocr識別,能夠唯一確定該路牌的位置,相當於乙個全域性觀測。比如,考慮到交通指示牌相互之間的間距很大,在區域性唯一,因此結合gps和指示牌即可唯一確定該指示牌的位置。根據mobileye的rem的專利描述,它們可能利用了該類資訊。

第四點即是本文想講解的一種方法。

本文主要想介紹一篇基於概率模型的語義定位方法。文章名字是semantic localization via the matrix permanent,是 university of pennsylvania 的grasp實驗室。還有一篇類似的文章,名字是localization from semantic observations via the matrix permanent。他們組後續一篇文章probabilistic data association for semantic slam得了icra2018最佳**獎。

本篇文章的出發點是用概率模型建模資料關聯過程,通過求解後驗概率\(p(z|y,x)\),利用粒子濾波的框架求解姿態\(x\)。其中,\(z\)是觀測,\(y\)是地圖中的路標點(landmark),\(x\)是姿態(pose)。這裡假設地圖已經建立,其中路標點的位置、類別等資訊已經包含在地圖中。文章的模型基於很少的先驗假設,只需要語義資訊和一些識別演算法的先驗概率,因此有很廣的適用範圍。

這篇文章的創新點個人總結有以下幾點。

先寫這些吧,下次再介紹一些具體的內容。

結合語義和關聯的aspect抽取優化

lifelong learning的aspect抽取工作研究 improving opinion aspect extraction using semantic similarity and aspect associations 使用dp dependency 的語法規則的挖掘方法,有很大的提公...

訊息佇列的消費語義和投遞語義

所謂的消費語義,指的就是如下三種情況 其實類似還有乙個投遞語義 說句實在話,其實還是老問題,只是換了一種問法!ok,開始我們的正文 我們先做如下約定 我們先從投遞語義開始講起,因為要先把這個概念講明白了,才能講消費語義。恰巧,kafka實現了這三種語義,我們以kafka來說明。如何保證訊息最多投遞一...

go 型別的值語義和引用語義

go語言重大部分型別都是基於值語義,包括 1.基本型別 byte,int,bool,float32,float64,string等 2.復合型別 陣列array,結構體struct,指標pointer等 重點來了,c c 中,陣列傳遞是引用語義,但在go中,陣列和基本型別沒啥區別,都是值語義,也就是...