yolov4網路結構 目標檢測YOLO V4

2021-10-12 00:09:50 字數 2452 閱讀 7606

一、yolo-v4主要做了什麼?

通俗的講,就是說這個yolo-v4演算法是在原有yolo目標檢測架構的基礎上,採用了近些年cnn領域中最優秀的優化策略,從資料處理、主幹網路、網路訓練、啟用函式、損失函式等各個方面都有著不同程度的優化,雖沒有理論上的創新,但是會受到許許多多的工程師的歡迎,各種優化演算法的嘗試。文章如同於目標檢測的trick綜述,效果達到了實現fps與precision平衡的目標檢測 new baseline。

①**主要有以下三點貢獻:

開發了乙個高效而強大的模型,使得任何人都可以使用一張1080ti或者2080ti gpu去訓練乙個超級快速和精確的目標檢測器。

驗證了一系列state-of-the-art的目標檢測器訓練方法的影響。

修改了state-of-the-art方法,使得他們在使用單個gpu進行訓練時更加有效和適配,包括cbn,pan,sam等。

②作者把訓練的方法分成了兩類:

bag of freebies:只改變訓練策略或者只增加訓練成本,比如資料增強。

bag of specials:外掛程式模組和後處理方法,它們僅僅增加一點推理成本,但是可以極大地提公升目標檢測的精度。

上圖總結了近些年的目標檢測檢測器的優化改進手段的方向結構組成,同時在下面對幾個重要改進的部分列出了改進的方法,如下:[3]

目前主流two-stage檢測器的主要架構

heads部分:

2. 下圖為 yolov4 網路結構的採用的演算法,其中保留了yolov3的head部分,修改了主幹網路為cspdarknet53,同時採用了spp(空間金字塔池化)的思想來擴大感受野,panet作為neck部分。

yolo-v4網路架構圖

3. 下圖為yolov4在技術處理的思維導圖:

yolo-v4的backbone與detector的主要技術實現

bof(bag of freebies)

在文中是指那些能夠提高精度而不增加推斷時間的技術。

2. bos(bag of specials)

是指那些增加稍許推斷代價,但可以提高模型精度的方法。

3.在目標檢測訓練中,通常對cnn的優化改進方法:

4.cspdarknet53

由**可知,cspdarknet53包含29個卷積層,725*725的感受野,27.6m引數。

backbone對比

5.關於cmbn

bn是對當前mini-batch進行歸一化。cbn是對當前以及當前往前數3個mini-batch的結果進行歸一化,本文提出的cmbn則是僅僅在這個batch中進行累積。在消融實驗中,cmbn要比bn高出不到乙個百分點。

6.關於sam

attention機制中的cbam, cbam含有空間注意力機制和通道注意力機制,

sam就是其中的空間注意力機制.

panet融合的時候使用的方法是addition, 詳解見:cvpr 2018 panet

yolov4演算法將融合的方法由加法改為乘法。

使用ms coco資料集,在每一行不同的gpu上,使用不同的網路跟yolov4進行的對比結果:(橫軸為fps,縱軸為ap值)

2.因為不同的演算法公布時可能在不同的gpu上進行測試,作者根據不同的gpu(maxwell/pascal/volta)分別列出了yolov4與其他演算法的更詳細的比較,即table 8、9、10,幀率大於等於30的用藍底標出。

圖一

圖二圖三yolov4 演算法在實時目標檢測演算法中精度最高,實現了精度和速度的最佳平衡。

目標檢測網路 YOLO V4(一)

最近,yolo v4的開源掀起了一波熱潮,根據給出的資料yolo v4實現了速度和精度的雙向突破,吊打了一系列的目標檢測網路。因此,考慮後續感測器融合的目標跟蹤研究的需要,研究yolo v4是不可或缺的部分,並且先學習github中的開源demo,再研究該網路的原理。1.基於linux下執行,首先執...

YOLO v3 網路結構分析

最近在看tensorflow,沒有經過實踐的學習總感覺很心虛,因此打算做點什麼。所以,那就從yolo入手吧,將yolo v3改寫為tensorflow版本來進行練手。那第一步便是需要對yolo網路結構有一定的理解,不能像之前僅僅用yolo訓練資料然後檢測目標那樣浮於表面。整個網路主要是由一系列的1x...

YOLO v2網路結構分析

原 yolo9000 better,faster,stronger yolo2網路中第0 22層是darknet 19網路,後面第23層開始,是新增的檢測網路。說明 route層的作用是進行層的合併 在第27層 直接新增了乙個passthrough layer 得到26 26的細粒度的特徵,然後將2...