單次目標檢測器 YOLO簡介

2022-08-12 03:51:08 字數 1921 閱讀 9823

yolo 在卷積層之後使用了 darknet 來做特徵檢測。

然而,它並沒有使用多尺度特徵圖來做獨立的檢測。相反,它將特徵圖部分平滑化,並將其和另乙個較低解析度的特徵圖拼接。例如,yolo 將乙個 28 × 28 × 512 的層重塑為 14 × 14 × 2048,然後將它和 14 × 14 ×1024 的特徵圖拼接。之後,yolo 在新的 14 × 14 × 3072 層上應用卷積核進行**。

yolo(v2)做出了很多實現上的改進,將 map 值從第一次發布時的 63.4 提高到了 78.6。yolo9000 可以檢測 9000 種不同類別的目標。

以下是 yolo **中不同檢測器的 map 和 fps 對比。yolov2 可以處理不同解析度的輸入影象。低解析度的影象可以得到更高的 fps,但 map 值更低。

yolov3 使用了更加複雜的骨幹網路來提取特徵。darknet-53 主要由 3 × 3 和 1× 1 的卷積核以及類似 resnet 中的跳過連線構成。相比 resnet-152,darknet 有更低的 bflop(十億次浮點數運算),但能以 2 倍的速度得到相同的分類準確率。

yolov3 還新增了特徵金字塔,以更好地檢測小目標。以下是不同檢測器的準確率和速度的權衡。

特徵金字塔網路(fpn)

檢測不同尺度的目標很有挑戰性,尤其是小目標的檢測。特徵金字塔網路(fpn)是一種旨在提高準確率和速度的特徵提取器。它取代了檢測器(如 faster r-cnn)中的特徵提取器,並生成更高質量的特徵圖金字塔。

資料流

fpn 由自下而上和自上而下路徑組成。其中自下而上的路徑是用於特徵提取的常用卷積網路。空間解析度自下而上地下降。當檢測到更高層的結構,每層的語義值增加。

fpn 中的特徵提取(編輯自原**)

ssd 通過多個特徵圖完成檢測。但是,最底層不會被選擇執行目標檢測。它們的解析度高但是語義值不夠,導致速度顯著下降而不能被使用。ssd 只使用較上層執行目標檢測,因此對於小的物體的檢測效能較差。

fpn 提供了一條自上而下的路徑,從語義豐富的層構建高解析度的層。

自上而下重建空間解析度(編輯自原**)

雖然該重建層的語義較強,但在經過所有的上取樣和下取樣之後,目標的位置不精確。在重建層和相應的特徵圖之間新增橫向連線可以使位置偵測更加準確。

增加跳過連線(引自原**)

下圖詳細說明了自下而上和自上而下的路徑。其中 p2、p3、p4 和 p5 是用於目標檢測的特徵圖金字塔。

文章出處:

谷歌最新目標檢測器EfficientDet

efficientdet scalable and efficient object detection 民間實現 谷歌大腦 mingxing tan ruoming pang 和 quoc v.le 提出新架構 efficientdet,結合 efficientnet 同樣來自該團隊 和新提出的 ...

檢測器編寫

大家好我是 噩靈 風雅今天沒事給大家做乙個 用c語言編寫檢測器工具 如果大家需要什麼工具編寫 可以到群裡 找我給我q留言由於在上學所以時間比較少!也可以發郵件找我xingya.4980 163.com當然也可以去我q空間裡我會把寫好的 放在我日誌裡 我空間位址是 另外再給大家推薦乙個免費學習的技術論...

加法檢測器

題目描述 maoge在教小maoge加法,他想計算出小maoge加法的準確度如何,但是因為題目太多了,他算不出來,所以找到了你。資料格式 輸入一行三個數a,b,c。c表示兩個加數和小maoge算出來的答案 a,b,c在0 10000之間 輸出一行乙個字串。如果小maoge算的答案和正確答案的差值在正...