1.設定類別數,設定劃分為多少個網格,每個網格**出來幾個邊框。原文是20個類別,並將劃分為7*7網格,每個網格**出2個邊框。
2.將縮放到448*448,然後輸入到cnn網路(卷積、池化、兩個全連線),然後輸出的就是7*7*30的tensor(20個物件分類的概率、2個bounding box的位置(2*4=8)、2個bounding box的置信度),通過處理輸出box_confidence box_xy box_wh box_class_probs。即在上可得到邊界框7*7*2=98.
3.設定閾值過濾邊框。
4.進行非極大值抑制(nms).
5.將最後輸出列表裡的邊界框顯示在,並顯示分數和所屬類別。
每個邊界框的中心點座標均為相對於其對應的cell左上點座標的偏移,此時即保證每個邊界框的中心點均落在其對應的cell中。其計算公式如下:
上式中:
參考鏈結
YOLO網路理解
將一幅影象分解成sxs個網格 cell 如果在拿到對目標進行人工標註的結果框 box 中心落在某乙個網格內,那這個網格就負責 這個目標。每個網格 b個box 一般是2 除了 每個box的位置 x y w h 之外,還要 乙個confidence值 乙個box一共五個要被 的值 再加上要 的類別的分數...
yolov3的yolo層理解
yolov3在經過多個卷積和上取樣之後最終得到的是三個卷積結果,每乙個卷積結果的長和寬分別是 13x13,26x26,52x52 深度資訊是 4 box資訊 1 物體判別資訊 80 classnum置信度 3 每個點上面計算幾個anchor yolo層的作用就是對這些資訊進行解碼操作。首先需要明白的...
YOLO 之理解預訓練和微調
問題描述 在閱讀yolo 的時候,總是出現預訓練 pretraining 以及微調 fine tuning 那麼問題來了 預訓練是什麼?為什麼要用預訓練?怎樣預訓練?微調是什麼?為什麼要用微調?怎樣微調?什麼是預訓練和微調?你需要搭建乙個網路模型來完成乙個特定的影象分類的任務。首先,你需要隨機初始化...