本文**:
以下博文**:
tld是一種演算法的簡稱,原作者把它叫做tracking-learning-detection。搞視覺的人看到這個名字都會嚇一跳,很ambitious的計畫。是09年的工作,不算太久,不過也不太新。網上關於這個的資源其實很多,很大程度和作者開放源**有關。
學習過程中碰到的第乙個問題就是資源太多---當然是相對這個領域而言,一般能找到乙個忠實再現演算法的原始碼就已經很好了。所以把找到的list一下,雖然有點浪費時間,希望可以對其他人有所幫助。具體的細節就不多說了,有很多很棒的分析也列在下面,比如zouxy09
寫的原始碼注釋,實在不能再詳細了。如果硬要找茬,那就是大段的文字讓人頭暈,也沒怎麼排版。我倒想畫幾個簡單的圖補充一下,不知有什麼好點的畫圖程式推薦(latex, or gnuplot?沒用過)
源**資源:
1. 原作者 zdenek kalal
作者主頁:
源**頁:
程式語言:matlab + c
tld原始碼理解
2.alan torres版
源**頁:
實現語言:c++
3. arthurv版
源**頁:
實現語言:c++
注:和上面的沒有發現任何區別
4. jmfs版
源**頁:
實現語言:c++
注:和上面兩個沒有區別,只不過加入了vs2010工程檔案,理論上可以直接在windows下編譯通過。不過opencv檢測不到作者的webcam(!!!),所以他用了另乙個videoinput類來handle攝像頭輸入。
this is an adaptation of arthurv's fork of opentld ()5. georg nebehay版 (終於有個不一樣的了。。。。)to be immeadiately runnable in visual studio 2010.
源**頁:
注2:這個版本需要安裝qt。不過好像作者關掉了qt的選項(相關**還在),所以可以編譯,但無法顯示結果
6. paul nader版(又乙個qt 版!)
qopentld:
源**頁:
注1:需要opencv和qt。 原系統要求qt 4.3.7opencv 2.2。
注2:windows和linux下都提供了編譯工程或makefile。估計也是唯一乙個移植到android平台下的tld!
7. ben pryke版(又乙個student project!)
源**頁:
注:依然是matlab+c/c++的混合實現。亮點是有很詳細的documentation(8頁),介紹了演算法的理解和實現細節。可以幫助理解原演算法
部落格資源(中文):
1. 庖丁解牛tld (yang_xian521)
注1:從文章看作者是基於原作者的matlab版分析的。從函式名看上面的2/3/4應該是matlab--->c++的"直譯",函式名都沒變。這樣最好,可以和下面的對照著看,同時學matlab和c++
2. tld(tracking-learning-detection)學習與原始碼理解 (zouxy09)
注1: 用的是<
注2: 下面三個是從這篇copy的
想說的話:
1. 分享:前段時間把 tld::init(...)看完了,本想一鼓作氣,其他的事太多只好放下。不過我對detection和tracking比較熟,init中已經把learning作了一遍,看懂了剩下的就容易了。現在重新撿起,無意中發現了zouxy09的注釋,省了太多力氣,半天就看完了。很多細節不用自己去摳--- 我們常抱怨這資源那文件太少,羨慕老外能力強,動作快,和他們願意分享關係太大。經常看到一些不錯的文章收藏起來,過幾天去看居然刪了!
可以理解可能是開公司要保密,但如果害怕別人知道了自己的思路就做不下去,那還是不要在這個領域做了。演算法只是思想,誰也壟斷不了。演算法也一定是不斷更新的, 抱著乙個演算法不放也存活不了幾年。原作者也基於這個技術開公司了,也沒見他們基於這個限制別人使用。sift,surf都patent了也沒聽說賺了大錢,kinect告訴你演算法也實現不了。要保密的是實現細節
另乙個pwp(pixel-wise posteriors),publish時間和tld差不多,效能看上去也很美,不過作者說要開源,一直沒有兌現。是個遺憾。個人覺得level set對部分遮擋效果應該很好,做到實時也不是難事
3. 總結:tld其實是乙個非常合適的入門和高階演算法:
a.有理論,有高質量的*****(bmvc, cvpr, icpr, 最後pami)
b.有源**!matlab, c++, windows, linux, .....你還想要啥?
c.有不同大牛小牛分享的詳細的介紹和詳細的**注釋(幾乎每一行都解釋到了)!
4.牽涉面廣,涉及到detection, tracking, classifcation,傳統的視覺技術就是這麼硬梆梆的劃分的三大類。研究完了對每一部分多少能有點心得。
the end
random fern 的理解
補充:
benchmark 2015版:
visual tracker benchmark
不過這些演算法都比較新 要看老的話主要是06年這篇*****
kcf全稱,相關濾波kernel correlation filter
文章出處 http://
arxiv.org/abs/1404.7584
這個是我現在主要看的演算法,目標跟蹤的演算法是有很多了,如果想乙個乙個全部研究的話,可以在這裡http://
cvlab.hanyang.ac.kr/tra
cker_benchmark/index.html
benchmark,包含了現在流行的演算法,並進行了分析,這就是目標跟蹤演算法的乙個綜述!
TLD視覺跟蹤演算法
tld是一種演算法的簡稱,原作者把它叫做tracking learning detection。搞視覺的人看到這個名字都會嚇一跳,很ambitious的計畫。是09年的工作,不算太久,不過也不太新。網上關於這個的資源其實很多,很大程度和作者開放源 有關。學習過程中碰到的第乙個問題就是資源太多 當然是...
TLD視覺跟蹤演算法
以下博文 tld是一種演算法的簡稱,原作者把它叫做tracking learning detection。搞視覺的人看到這個名字都會嚇一跳,很ambitious的計畫。是09年的工作,不算太久,不過也不太新。網上關於這個的資源其實很多,很大程度和作者開放源 有關。學習過程中碰到的第乙個問題就是資源太...
TLd跟蹤演算法
作者 的鏈結 原始碼為linux版本,基於opencv2.3 在原始碼 doc資料夾下有其程式設計介面,很清晰。zk關於這個tld框架發表了很多 感覺對理解 非常有用的 有下面三個 1 tracking learning detection 2 forward backward error auto...