第四節,目標檢測 YOLO系列

2022-05-02 14:54:10 字數 1786 閱讀 4629

1、r-cnn回顧

適應全卷積化cnn結構,提出全卷積化設計

位置敏感池化(position-sensitive roi pooling)

r-fcn的位置敏感卷積層

使用k2(c+1)個通道對(位置,類別)組合進行編碼

r-fcn的位置敏感roi池化層

顯式地編碼相對位置資訊

r-fcn的多工損失函式

2、yolo v1:googlenet前20層

yolo將物體檢測任務當作乙個regression問題來處理,通過yolo,每張影象只需要「看一眼」就能得出影象中都有哪些物體和這些物體的位置。

將一幅影象分成sxs個網格(grid cell),圖中物體「狗」的中心點(紅色原點)落入第5行、第2列的格仔內,所以這個格仔負責**影象中的狗。

每乙個柵格**b(b=2)個bboxes,以及這些bboxes的confidence scores。

confidence scores反映了模型對於這個柵格的**:該柵格是否含有物體,以及這個box的座標**的有多準。

如果這個柵格中不存在object,則confidence score應該為0;否則的話,confidence score則為predicted bound ing box與ground truth box之間的iou(intersection over union)

在測試階段,將每個柵格的條件類別概率與你每個bbox的confidence相乘:

nms(非極大值抑制):

yolo v1的優點:

yolo v1的不足:

3、yolo v2改進

high resolution classifier

convolutional with anchor boxes

dimension clusters

multi-scale training

yolo v2的基礎模型是darknrt-19:

使用較多的3*3卷積核,在每一次池化操作後把通道數翻倍。

網路使用了全域性平均池化,把1*1的卷積核置於3*3的卷積核之間,用來壓縮特徵。

使用了bn穩定模型訓練。

4、yolo v3

yolo v3中使用了乙個53層的卷積網路,這個網路由殘差單元疊加而成。

yolo v3使用邏輯回歸**每個邊界框的分數。

為了實現多標籤分類,模型不再使用softmax函式作為最終的分類器,而是使用binary cross-entropy作為損失函式。

多尺度**:yolo v3從三種不同尺度夫人特徵圖譜上進行**任務。

ObjC第四節 繼承

繼 承 1 繼承 1.1 nsobject,根類,oc建立的類都繼承自根類,位於類層次結構的頂層,沒有父類 1.2 父類的例項變數和方法都可以被隱式的繼承過來成為子類的一部分,子類就可以直接訪問這些例項變數和方法 1.3 alloc和init是繼承自nsobject的方法 1.4 繼承的概念呈單鏈繼...

第四節 條件語句

if語句 if v 100else if v 50elseif語句不需要括號 用法高階 const filename abc.txt if contents,error ioutil.readfile filename error nilelse注意 contents和error變數都是在if 塊中...

Python基礎第四節

字典是 鍵值對 的無序可變序列,其中每個元素都是乙個 鍵值對 包含 鍵物件 和 值物件 就像可通過列表元素索引值獲取對應物件,我們可通過 鍵物件 獲取 刪除 更新其對應的值物件。鍵必須是不可變資料,如整數 浮點數 字串 元組,不能是字典 列表 集合等可變物件,鍵不可重複。若重複出現鍵,則後面的覆蓋前...