菜鳥看TLD之一 為什麼要研究TLD

2021-06-16 14:06:32 字數 1132 閱讀 6926

算來從小碩接到有關運動跟蹤的任務也有接近乙個月了,由於運動跟蹤這一塊不是我們那組的傳統方向,萬事只能靠自己。入門階段抓狂了不少日子,沒頭蒼蠅般看了不少**和原始碼,抓狂原因無非幾個,有**沒**,有**的或者太老或者沒**,當然內功太差(包括問題抽取能力,資料搜尋能力,演算法理解能力等)也是根本原因。忽然有一天,認識網上一朋友,建議我去看看tld。去google一下果然眼前一亮,首先就是作者的個人主頁。前面也找到過不少作者的主頁附有**和原始碼的,但資料有那麼全的,而且還算比較新的(從08-11),加之高水平**(pami,cvpr,bmvc,icpr,icip)還是不多。更令人欣喜的是有那麼多牛人在部落格中給出了注釋和討論,令人感覺就像在沙漠中走了好多天看到人的感覺一樣。於是小碩便一發不可收的陷入了tld的學習中。

兩周的學習,在演算法本身之外隱約感覺到了對乙個問題有了一點新的感悟,那就是:怎麼做乙個成功的研究者?首先就是選擇問題的切入點,拿追蹤問題來說,檢測與跟蹤向來都是運動跟蹤問題兩個基本問題,綜合兩個問題來聯合解決運動跟蹤問題應該是一般人都可以想到的基本思路,前人也做過一些類似的工作,如(kalman濾波+camshift)。然而,卻不是每個人都可以想到通過乙個learning模組,來巧妙地利用檢測器和***的雙方面資訊來綜合跟蹤物體。切入之後下一步就是像切西瓜似的,要將問題成功分塊,分而治之才可以現實地解決問題,在這個過程中,力求對其中關鍵問題進行解決,以期通過優化模組來優化整體。這一點我們可以看到dr. zdenek的**從時間上來看是乙個總-分-總的格局。從框架——***——pn學習——框架。那麼我們可以從研究方法上來說需要做的是理清思路——然後尋找關鍵問題——解決關鍵問題——總結,從而形成乙個完整的結構。記得李開復在他自傳中說他導師和他講過:「博士就是在乙個狹窄的領域做出世界一流的研究」。從研究點來講乙個單目標的跟蹤問題從問題本身來說不算大,但如dr. zdenek一樣,這個領域從來不乏傑出的研究者和研究成果。這些天的對演算法的學習又一次讓有志於去讀博作研究的我得到一點啟發吧。

廢話說了很多,其實也就是乙個想法。如果我們有志於向牛人的方向努力,那在每次學習中,不應該只注重方法本身,更應該注重方法的作者是怎麼發現它的,他是怎麼思考的,又是怎麼去探索出解決方案的。就如一句古話「授人以魚不如授人以漁」,同樣在學習中也是「學人以魚不如學人以漁」。接下來的系列中,小碩期待總結一下學習所得,因此研究演算法的牛人及其演算法分析已然很多,故名為菜鳥看tld系列。以期有朝一日也能學人以「漁」成為牛人。

linux下平台匯流排之一為什麼要引入平台匯流排

平台平台可以理解為乙個虛擬的匯流排,主要描述soc上的資源,這些資源的共同點是cpu可以直接訪問的資源。為什麼要用這個平台匯流排,平台裝置,平台驅動?1個linux裝置,驅動總要掛載在一條匯流排上面,比如usb i2c i2s spi,對於這種裝置它們本身就已經有一條對應的匯流排了,但在嵌入式系統中...

Vlan知識之一 為什麼需要VLAN

為什麼需要vlan 什麼是vlan?vlan virtual lan 翻譯成中文是 虛擬區域網 lan可以是由少數幾台家用計算機構成的網路,也可以是數以百計的計算機構成的企業網路。vlan 所指的lan 特指使用路由器分割的網路 也就是廣播域。在此讓我們先複習一下廣播域的概念。廣播域,指的是廣播幀 ...

神經網路為什麼要歸一化

神經網路為什麼要歸一化 1.數值問題。無容置疑,歸一化的確可以避免一些不必要的數值問題。輸入變數的數量級未致於會引起數值問題吧,但其實要引起也並不是那麼困難。因為tansig的非線性區間大約在 1.7,1.7 意味著要使神經元有效,tansig w1 x1 w2 x2 b 裡的 w1 x1 w2 x...