2018 december 04
yolo系列總結
相比 rcnn系列,yolo 系列的主要缺點:
主要原因是每個網格**固定數量的物體使候選框數量減少;
yolo v1
yolo v2—— darknet19
yolo v3—— darknet53
yolo v1—— 無
yolo v2—— 維度拼接,一次,第 16 層 26x26x512 → 13x13x2048 與第 24 層拼接;
yolo v3—— 維度拼接,兩次
yolo v1—— 兩層全連線層;
yolo v2—— 無(大大減少了引數規模);
yolo v3—— 無
yolo v1—— 無
yolo v2—— 無
yolo v3—— 非線性插值法,上採用兩次;
yolo v1—— 無
yolo v2
yolo v3
yolo v1—— grid cell
yolo v2—— anchor box + offset + sigmoid activation
yolo v3—— 同 v2;
yolo v1
yolo v2
yolo v3—— 同 v2;
yolo v1—— 預訓練模型輸入大小為 224x224,檢測模型輸入大小為 448 x 448;
yolo v2—— multi-scale training:每個 10 個 batches 隨機選擇一種解析度輸入(320~608,32的倍數);
yolo v3—— 同 v2;
yolo v1
yolo v2
yolo v3—— 同 v2;
yolo v1—— 也使用了 bn,同時在 fc 中使用 dropout
yolo v2—— 取消 dropout 均使用 bn:提公升模型泛化能力的同時使得模型更容易收斂;
yolo v3—— 同 v2;
yolo v1——
yolo v2—— sgd
yolo v3
yolo v1
yolo v2—— softmax loss
yolo v3—— logistic loss
yolo v1—— 對寬高都進行開根,使得**相同的偏差時更小的框產生更大的損失;
yolo v2—— 使用 $2 - w_*h_$,使小物體的懲罰比大物體重;
yolo v3—— 同 v2;
我的yolo系列總結
探索資料集製作過程中的一些筆記。處理時基本都是利用excel,txt,csv進行,更新中。主要記錄了一些txt的合併,後來發現對於乙個python不是很熟的人,其實結合excel更快 主要記錄了一些如果資料集是按照類別放的話,直接讀取不是很方便,但是將目錄拼起來直接讀取更方便些 主要記錄了一些批量修...
YOLO系列概覽
1.yolo v1 採用乙個24層的卷積網路加2個全連線層。將畫面分成s s個部分,每個部分負責 b個框,每個框有x,y,w,h,confidence 是否有目標,iou為多少 五個 引數。在voc資料集中,有20個類別。演算法中,b 2,即每個分格 2個框。所以,最後的輸出向量維度為s s 30,...
YOLO演算法總結
步驟 1.輸入 608,608,3 2.經過cnn處理,輸出 19,19,5,85 3.展開以上矩陣後為 19,19,425 每個19 19的網格裡有425個數字 425 5 85,每個網格裡有5個achor box,achor box中有85個數字 85 5 80,pc,bx,by,bw,bh,c...