1、r-cnn回顧
適應全卷積化cnn結構,提出全卷積化設計
位置敏感池化(position-sensitive roi pooling)
r-fcn的位置敏感卷積層
使用k2(c+1)個通道對(位置,類別)組合進行編碼
r-fcn的位置敏感roi池化層
顯式地編碼相對位置資訊
r-fcn的多工損失函式
2、yolo v1:googlenet前20層
yolo將物體檢測任務當作乙個regression問題來處理,通過yolo,每張影象只需要「看一眼」就能得出影象中都有哪些物體和這些物體的位置。
將一幅影象分成sxs個網格(grid cell),圖中物體「狗」的中心點(紅色原點)落入第5行、第2列的格仔內,所以這個格仔負責**影象中的狗。
每乙個柵格**b(b=2)個bboxes,以及這些bboxes的confidence scores。
confidence scores反映了模型對於這個柵格的**:該柵格是否含有物體,以及這個box的座標**的有多準。
如果這個柵格中不存在object,則confidence score應該為0;否則的話,confidence score則為predicted bound ing box與ground truth box之間的iou(intersection over union)
在測試階段,將每個柵格的條件類別概率與你每個bbox的confidence相乘:
nms(非極大值抑制):
yolo v1的優點:
yolo v1的不足:
3、yolo v2改進
high resolution classifier
convolutional with anchor boxes
dimension clusters
multi-scale training
yolo v2的基礎模型是darknrt-19:
使用較多的3*3卷積核,在每一次池化操作後把通道數翻倍。
網路使用了全域性平均池化,把1*1的卷積核置於3*3的卷積核之間,用來壓縮特徵。
使用了bn穩定模型訓練。
4、yolo v3
yolo v3中使用了乙個53層的卷積網路,這個網路由殘差單元疊加而成。
yolo v3使用邏輯回歸**每個邊界框的分數。
為了實現多標籤分類,模型不再使用softmax函式作為最終的分類器,而是使用binary cross-entropy作為損失函式。
多尺度**:yolo v3從三種不同尺度夫人特徵圖譜上進行**任務。
ObjC第四節 繼承
繼 承 1 繼承 1.1 nsobject,根類,oc建立的類都繼承自根類,位於類層次結構的頂層,沒有父類 1.2 父類的例項變數和方法都可以被隱式的繼承過來成為子類的一部分,子類就可以直接訪問這些例項變數和方法 1.3 alloc和init是繼承自nsobject的方法 1.4 繼承的概念呈單鏈繼...
第四節 條件語句
if語句 if v 100else if v 50elseif語句不需要括號 用法高階 const filename abc.txt if contents,error ioutil.readfile filename error nilelse注意 contents和error變數都是在if 塊中...
Python基礎第四節
字典是 鍵值對 的無序可變序列,其中每個元素都是乙個 鍵值對 包含 鍵物件 和 值物件 就像可通過列表元素索引值獲取對應物件,我們可通過 鍵物件 獲取 刪除 更新其對應的值物件。鍵必須是不可變資料,如整數 浮點數 字串 元組,不能是字典 列表 集合等可變物件,鍵不可重複。若重複出現鍵,則後面的覆蓋前...