定位 + 分類問題是分類到目標檢測的乙個過渡問題,從單純地分類到分類後給出目標所處位置,再到多目標的類別和位置。接下來,我們看一下定位+ 分類問題的解法。
分類不用多說,上一章我們以分類為例講了卷積神經網路。在定位問題中,則需要模型返回目標所在的外接矩形框,即目標的(x,y,w,h)四元組。
接下來介紹一種比較容易想到的思路,把定位當做回歸問題,具體步驟如下:
(2)在分類網路最後乙個卷積層的特徵層(feature map)上新增「regression head」,如圖1-2 所示;補充說明:神經網路中不同的「head」通常用來訓練不同的目標,每個「head」的損失函式和優化方向不同。如果想讓乙個網路實現多個功能,通常是在神經網路後面接多個不同功能的「head」。
(3)同時訓練「classification head」和「regression head」,為了同時訓練分類和定位(定位是回歸問題)兩個問題,最終損失函式是分類和定位兩個「head」產生損失的加權和。
(4)在**時同時使用分類和回歸head 得到分類+ 定位結果。這裡強調一下,分類**出的結果就是c 個類別,回歸**的結果可能有兩種:一種是類別無關,輸出4個值;一種是類別相關,輸出4*c 個值,這要看讀者想要哪種結果了。
目標檢測入門系列手冊五 YOLO訓練教程
由於在r cnn 的系列演算法中都需要首先獲取大量proposal,但proposal 之間有很大的重疊,會帶來很多重複的工作。yolo 5 一改基於proposal 的 思路,將輸入劃分成sxs 個小格仔,在每個小格仔中做 最終將結果合併,如圖2 14 所示。接下來我們看一下yolo 學習的關鍵步...
目標檢測入門
檢測任務需要同時 物體的類別和位置,因此需要引入一些跟位置相關的概念。通常使用邊界框 bounding box,bbox 來表示物體的位置,邊界框是正好能包含物體的矩形框,如圖所示,圖中3個人分別對應3個邊界框。通常有兩種格式來表示邊界框的位置 xyxy,即 x1,y1,x2,y2 其中 x1,y1...
目標檢測精讀系列
1.概述 目標檢測是乙個比較活躍的領域,其目標是通過演算法檢測出影象中的感興趣目標。目前,基本上最先進的目標檢測演算法都是基於神經網路。在深度學習之前,基本上是提取特定角點 sift,hog等 去檢測目標,或是利用劃窗的方式結合svm等經典分類器去檢測目標,這類傳統的演算法的檢測效果不佳。隨著卷積神...