YOLO系列概覽

2021-10-06 20:39:12 字數 601 閱讀 8465

1.yolo v1

採用乙個24層的卷積網路加2個全連線層。

將畫面分成s*s個部分,每個部分負責**b個框,每個框有x,y,w,h,confidence(是否有目標,iou為多少)五個**引數。

在voc資料集中,有20個類別。

演算法中,b=2,即每個分格**2個框。所以,最後的輸出向量維度為s*s*30,30=5+5+20,最後20個引數代表屬於每乙個類別的概率,這個概率由**的2個框共享。

由此,也能看出v1的乙個重大缺陷:每個分格實際只可以**乙個目標,因為分類概率共享,對於目標密集的畫面,**效果不佳。

2.yolo v2

還未學習

3.yolo v3

採用darknet53網路,該網路是全卷積網路,沒有全連線層,網路結構為幾個卷積層中加入乙個殘差層,可以理解為卷積網路和殘差網路的一種組合。

畫面分成s*s個部分,每個部分負責**b個框,每個框有x,y,w,h,confidence(是否有目標,iou為多少)五個**引數。

**中,每個部分**3個框,分類為80個類別,類別概率不共享,故輸出向量維度變為:s*s*(5+80)*3=s*s*255。

最終的輸出層還加入了多感受維度,類似ssd演算法。

YOLO系列總結

2018 december 04 yolo系列總結 相比 rcnn系列,yolo 系列的主要缺點 主要原因是每個網格 固定數量的物體使候選框數量減少 yolo v1 yolo v2 darknet19 yolo v3 darknet53 yolo v1 無 yolo v2 維度拼接,一次,第 16 ...

我的yolo系列總結

探索資料集製作過程中的一些筆記。處理時基本都是利用excel,txt,csv進行,更新中。主要記錄了一些txt的合併,後來發現對於乙個python不是很熟的人,其實結合excel更快 主要記錄了一些如果資料集是按照類別放的話,直接讀取不是很方便,但是將目錄拼起來直接讀取更方便些 主要記錄了一些批量修...

YOLO系列學習筆記

此文參考 1 給乙個大小為448x448的輸入影象,首先將影象劃分成7 7的網格。2 對於每個網格,每個網格 2個bouding box 每個box包含5個 量 以及20個類別概率,總共輸出7 7 2 5 20 1470個tensor 3 根據上一步可以 出7 7 2 98個目標視窗,然後根據閾值去...