分類任務已經熟悉了,就是演算法遍歷,判斷其中的物件是不是汽車
定位分類問題,這意味著不僅要用演算法判斷中是不是一輛汽車
還要在中標記出它的位置
如果正在構建汽車自動駕駛系統,那麼物件可能包括以下幾類:行人、汽車、電單車和背景
這意味著中沒有行人、電單車和背景,輸出結果會是汽車
如果還想定位中汽車的位置
那麼可以讓神經網路多輸出幾個單元,輸出乙個邊界框
具體說就是讓神經網路再多輸出4個數字,標記為bx,by,bh和bw
這四個數字是被檢測物件的邊界框的引數化表示
左上角的座標為(0,0),右下角標記為(1,1)
要確定邊界框的具體位置,需要指定紅色方框的中心點
這個點表示為(bx,by),邊界框的高度為bh,寬度為bw
因此訓練集不僅包含神經網路要**的物件分類標籤
還要包含表示邊界框的這四個數字
接著採用監督學習演算法,輸出乙個分類標籤,還有四個引數值,從而給出檢測物件的邊框位置
此例中,bx的理想值是0.5,表示汽車位於水平方向的中間位置
by大約是0.7,表示汽車位於距離底部3/10的位置
bh約為0.3,因為紅色方框的高度是高度的0.3倍
bw約為0.4,紅色方框的寬度是寬度的0.4倍
為監督學習任務定義目標標籤 y,這有四個分類
神經網路輸出的是這四個數字和乙個分類標籤或分類標籤的概率
目標標籤y的定義如下:
y =[
pcbx
bybh
bwc1
c2c3
]y= \left[ \begin p_c \\b_x\\b_y\\b_h\\b_w\\c_1\\c_2\\c_3 \end \right]
y=⎣⎢⎢⎢
⎢⎢⎢⎢
⎢⎢⎢⎡
pc
bxb
ybh
bw
c1c
2c3
⎦⎥
⎥⎥⎥⎥
⎥⎥⎥⎥
⎥⎤如果物件屬於前三類(行人、汽車、電單車),則pc=1
如果是背景,則中沒有要檢測的物件,則pc=0
可以這樣理解pc,它表示被檢測物件屬於某一分類的概率,背景分類除外
如果檢測到物件,就輸出被檢測物件的邊界框引數bx、by、bh和bw
最後,如果存在某個物件,那麼pc=1
同時輸出c1、c2和c3,表示該物件屬於行人,汽車還是電單車中的哪一類
鑑於所要處理的問題,假設中只含有乙個物件
所以針對這個分類定位問題,最多隻會出現其中乙個物件
假如這是一張訓練集,標記為x,即上圖的汽車
而在y當中,第乙個元素pc=1
因為圖中有一輛車,bx、by、bh和bw會指明邊界框的位置
所以標籤訓練集需要標籤的邊界框
中是一輛車,所以結果屬於分類2,因為定位目標不是行人或電單車,而是汽車
所以c1=0,c2=1,c3=0
並且c1、c2和c3中最多只有乙個等於1
如果在背景的情況下
pc=0,y的其它引數將變得毫無意義
全部寫成問號,表示「毫無意義」的引數
神經網路的損失函式,其引數為類別y
yy和網路輸出y
^\hat
y^如果採用平方誤差策略,則l(y
^\hat
y^,y
yy) = (y
^\hat
y^1 - y
yy1)2 +(y
^\hat
y^2 - y
yy2)^2 +⋯(y
^\hat
y^8 - y
yy8)^2
損失值等於每個元素相應差值的平方和
中存在定位物件,y1=1,所以y1=pc,損失值就是不同元素的平方和
另一種情況是,y1=0,即pc=0,損失值是(y
^\hat
y^1 - y
yy1)2
不用考慮其它元素,只需關注神經網路輸出pc的準確度
參考:
吳恩達深度學習 目標定位
這一周我們學習的主要內容是物件檢測,它是計算機視覺領域中乙個新興的應用方向,相比前兩年,它的效能越來越好。在構建物件檢測之前,我們先了解一下物件定位,首先我們看看它的定義。分類任務我們已經熟悉了,就是演算法遍歷,判斷其中的物件是不是汽車,這就是分類。這節課我們要學習構建神經網路的另乙個問題,即定位分...
複雜場景下的多目標定位 深度學習演算法綜述
一 背景知識 目標定位是計算機視覺的重要應用場景之一。在工業生產 航空航海 農產品包裝等眾多領域內均已得到廣泛應用。在工業生產中,通過目標定位可以實現精準地完成自動抓取 自動上料等操作 在航空航海中,利用目標定位可以為海上打撈等工作提供可靠的位置服務 在交通運輸中,借助目標定位可以準確獲取車輛的位置...
目標定位和特徵點檢測
目標檢測是計算機視覺領域中的乙個新興的應用方向,在構建目標檢測之前,我們首先了解一下object localization目標定位。前面說過的分類任務就是演算法遍歷,判斷其中的物件是不是汽車,主要是分類 這裡所說的目標定位指的是我們不僅要用演算法判斷中是不是一輛汽車,還要在中標記出它的位置,用邊框或...