文章對**中的翻譯做了一些筆記,方便在演算法使用過程中遇到問題時檢視
jpdaf
中,單個狀態假設是通過關聯概率對單個測量值進行加權而產生的。在
mht中,所有可能的假設都被跟蹤,但為了計算的可操作性,必須應用剪枝方案。這些方法的效能取決於計算量和實現複雜性。
深度關聯度量:
軌道處理和卡爾曼濾波框架與soart中的原始公式基本相同。我們假設乙個非常普遍的跟蹤場景,在這個場景中,相機沒有校準,我們沒有可用的自我運動資訊。正種場景是現實中最常見的。我們的跟蹤場景是在八維狀態空間種,包含目標框的中心位置(u,v)、寬高比r、高h及其各自在影象座標中的速度。採用標準的等速度運動卡爾曼濾波器和線性觀測模型,取邊界座標(u,v,r,h)作為對物體狀態的直接觀測值。
對於每個目標的軌道k,我們計算自上次成功測量關聯ak以後的幀數。該計數器(幀數)在卡爾曼濾波**期間遞增,當跟蹤軌跡與目標檢測成功關聯(iou值大於最小閾值)時重置為0。計數器的值超過預先定義的最大閾值amax後,目標被認為已經離開現場,並從目標軌道集刪除。對於不能與現有目標軌跡關聯的每個被檢測到的目標,都會初始化乙個新的初始假設軌跡(檢驗虛假檢測)。這些軌跡的前3幀被歸類為試探性軌跡。在此期間(3個幀),我們期望在每個時間步驟(每一幀)中都有乙個成功的度量關聯。新目標軌跡的前三幀若沒有成功關聯,那麼這個目標軌跡將被刪除。
指派問題(匈牙利演算法):
傳統解決現有目標的結果(檢測框)與卡爾曼**結果(**框)之間關聯的方式是構建乙個指派問題,該問題可以用匈牙利演算法解決。在解決這個問題的工程中,我們整合了運動和外觀資訊。
為了整合執行資訊,我們使用馬氏距離來度量目標檢測值和卡爾曼**值直接的距離。
其中表示由
(yi,
si)將目標的第
i個軌跡分布投影到測量空間,由
dj檢測第
j個邊界框。馬氏距離通過測量檢測到的多個偏離平均軌道位置的標準差,將狀態估計的不確定性考慮在內。標準偏差檢測距離(馬氏距離)的平均軌跡更遠,使用這個度量,可以通過在反卡方分布計算的
95%置信區間內,以馬氏距離作為閾值來排除不太可能的關聯。
如果第i個目標軌道**值(**框)和第j個目標檢測值(檢測框)值之間的關聯(馬氏距離)小於一定的閾值,那麼它的值為1。對於我們的四維測量空間,對應的馬氏閾值為t(1) = 9.4877。
當運動不確定性較低時,馬氏距離是乙個合適的關聯度量,而在我們的影象空間問題公式中,卡爾曼濾波框架得到的**狀態分布只能粗略估計目標位置。特別是,不明原因的相機運動會在影象平面中引入快速位移,使得馬氏距離對遮擋物體的跟蹤變得很差。因此,在指派問題中我們引入了第二個度量。對於每個檢測出的邊界框dj,我們計算乙個外觀描述符rj, ||rj|| = 1。此外,我們保留乙個集合rk=
同樣,我們引入乙個二元變數來表示根據這個度量是否關聯成功:
我們在乙個單獨的訓練資料集上為這個指標找到了乙個合適的閾值。在實踐中,我們使用乙個預先訓練的cnn來計算邊界框的外觀描述符。該網路的體系結構將在第2.4節中描述。
通過組合,這兩個度量標準在指派問題中互相補充。一方面,馬氏距離提供了基於運動的跟蹤目標可能的位置資訊,這對短期**特別有用。另一方面,余弦距離考慮了外觀資訊,這在運動的辨別性較低的情況下,對長時間遮擋後恢復身份認證非常有效。為了構建關聯問題,我們使用加權和將這兩個指標結合起來
其中,如果關聯在兩個指標的門控區域內,我們稱其為可容許關聯:
通過超引數λ可以控制各指針對組合關聯成本的影響。通過實驗我們發現,當有大量的攝像機運動時,設定λ=0是乙個合理的選擇。在此設定中,僅把外觀資訊應用到了關聯成本項中,但是這個馬氏門仍然可以用於刪除基於卡爾曼濾波**出的不可能的賦值(**出的假框)。
匹配的級聯:
在全域性分配問題中,我們引入了乙個級聯方法來解決一系列子問題,而不是求解度量到跟蹤的關聯。當乙個目標長時間被遮擋之後,卡爾曼濾波**的不確定性就會大大增加。假如此時兩個追蹤器同時競爭乙個檢測結果的匹配權,往往遮擋時間較長的那條軌跡的資訊馬氏距離協方差更小,因為這些軌跡長時間未更新,不確定性增大,協方差更大,馬氏距離計算時使用了協方差的倒數。因此使得檢測結果更可能和遮擋時間較長的那條軌跡相關聯,這種結果會破壞追蹤的持續性。級聯匹配的核心思想就是由小到大按照消失時間排序進行軌跡進行匹配,保證對最近出現且小時時間最短的目標優先匹配。
deepsort多目標跟蹤
題目 online and realtime tracking with a deep association metric deepsort是在sort目標追蹤基礎上的改進。引入了在行人重識別資料集上離線訓練的深度學習模型,在實時目標追蹤過程中,提取目標的表觀特徵進行最近鄰匹配,可以改善有遮擋情況...
多目標跟蹤
目前參與的乙個專案是 足球事件檢索 事件是乙個 high level 概念,需要基於一些 low level 資訊來做。後者主要就是一些影象處理的東西了。兩個 level 之間,會有一些中間層的資訊,比如足球的走向。根據師兄的建議,可以考慮對足球場上的運動員進行多目標跟蹤,在跟蹤軌跡的基礎上抽取一些...
人臉跟蹤 sort多目標跟蹤
多目標跟蹤中sort演算法的理解 在跟蹤之前,對所有目標已經完成檢測,實現了特徵建模過程。1.第一幀進來時,以檢測到的目標初始化並建立新的 標註id。2.後面幀進來時,先到卡爾曼濾波器中得到由前面幀box產生的狀態 和協方差 求 所有目標狀態 與本幀檢測的box的iou,通過匈牙利指派演算法得到io...