TLD視覺跟蹤演算法

以下博文**：

tld是一種演算法的簡稱，原作者把它叫做tracking-learning-detection。搞視覺的人看到這個名字都會嚇一跳，很ambitious的計畫。是09年的工作，不算太久，不過也不太新。網上關於這個的資源其實很多，很大程度和作者開放源**有關。

學習過程中碰到的第乙個問題就是資源太多---當然是相對這個領域而言，一般能找到乙個忠實再現演算法的原始碼就已經很好了。所以把找到的list一下，雖然有點浪費時間，希望可以對其他人有所幫助。具體的細節就不多說了，有很多很棒的分析也列在下面，比如zouxy09

寫的原始碼注釋，實在不能再詳細了。如果硬要找茬，那就是大段的文字讓人頭暈，也沒怎麼排版。我倒想畫幾個簡單的圖補充一下，不知有什麼好點的畫圖程式推薦(latex， or gnuplot?沒用過)

源**資源：

1. 原作者 zdenek kalal

作者主頁：

源**頁:

程式語言：matlab + c

2.alan torres版

源**頁：

實現語言：c++

3. arthurv版

源**頁：

實現語言：c++

注：和上面的沒有發現任何區別

4. jmfs版

源**頁：

實現語言：c++

注：和上面兩個沒有區別，只不過加入了vs2010工程檔案，理論上可以直接在windows下編譯通過。不過opencv檢測不到作者的webcam（！！！），所以他用了另乙個videoinput類來handle攝像頭輸入。

this is an adaptation of arthurv's fork of opentld ()

to be immeadiately runnable in visual studio 2010.

5. georg nebehay版（終於有個不一樣的了。。。。）

源**頁：

注2：這個版本需要安裝qt。不過好像作者關掉了qt的選項（相關**還在），所以可以編譯，但無法顯示結果

6. paul nader版（又乙個qt 版！）

qopentld:

源**頁：

注1：需要opencv和qt。原系統要求qt 4.3.7opencv 2.2。

注2：windows和linux下都提供了編譯工程或makefile。估計也是唯一乙個移植到android平台下的tld!

7. ben pryke版（又乙個student project！）

源**頁：

注：依然是matlab+c/c++的混合實現。亮點是有很詳細的documentation（8頁），介紹了演算法的理解和實現細節。可以幫助理解原演算法

部落格資源（中文）：

1. 庖丁解牛tld （yang_xian521）

注1:從文章看作者是基於原作者的matlab版分析的。從函式名看上面的2/3/4應該是matlab--->c++的"直譯"，函式名都沒變。這樣最好，可以和下面的對照著看，同時學matlab和c++

2. tld（tracking-learning-detection）學習與原始碼理解 (zouxy09)

注1：用的是<

注2：下面三個是從這篇copy的

想說的話：

1. 分享：前段時間把 tld::init(...)看完了，本想一鼓作氣，其他的事太多只好放下。不過我對detection和tracking比較熟，init中已經把learning作了一遍，看懂了剩下的就容易了。現在重新撿起，無意中發現了zouxy09的注釋，省了太多力氣，半天就看完了。很多細節不用自己去摳--- 我們常抱怨這資源那文件太少，羨慕老外能力強，動作快，和他們願意分享關係太大。經常看到一些不錯的文章收藏起來，過幾天去看居然刪了！

可以理解可能是開公司要保密，但如果害怕別人知道了自己的思路就做不下去，那還是不要在這個領域做了。演算法只是思想，誰也壟斷不了。演算法也一定是不斷更新的，抱著乙個演算法不放也存活不了幾年。原作者也基於這個技術開公司了，也沒見他們基於這個限制別人使用。sift，surf都patent了也沒聽說賺了大錢，kinect告訴你演算法也實現不了。要保密的是實現細節

另乙個pwp（pixel-wise posteriors），publish時間和tld差不多，效能看上去也很美，不過作者說要開源，一直沒有兌現。是個遺憾。個人覺得level set對部分遮擋效果應該很好，做到實時也不是難事

3. 總結：tld其實是乙個非常合適的入門和高階演算法：

a.有理論，有高質量的*****（bmvc, cvpr, icpr, 最後pami）

b.有源**！matlab， c++， windows, linux, .....你還想要啥？

c.有不同大牛小牛分享的詳細的介紹和詳細的**注釋（幾乎每一行都解釋到了）！

4.牽涉面廣，涉及到detection, tracking, classifcation，傳統的視覺技術就是這麼硬梆梆的劃分的三大類。研究完了對每一部分多少能有點心得。

the end

TLD視覺跟蹤演算法

TLD視覺跟蹤演算法

TLD視覺跟蹤演算法

TLd跟蹤演算法

相關推薦