R CFN學習筆記

2021-07-25 13:09:09 字數 1418 閱讀 9611

**:《r-fcn: object detection via region-based fully convolutional networks》

此**是微軟亞洲研究院的代季峰在2023年提出來的一篇目標檢測的很牛的**,相比較以前的rcnn、spp、fast_rcnn以及faster_rcnn在檢測速度上有了很大的提公升,我自己也在caffe框架裡面用了r-fcn,網路結構主要是用了resnet(101效果是最好的),**中也提了在檢測效果上和以前的faster_rcnn是差不多的,但是其檢測速度可是faster_rcnn的好幾倍,這確實厲害了,還是值得運用的。

為了介紹r-fcn的創新點,下面先說說以前基於region proposal的主流的目標檢測網路,主要有:rcnn、spp、fast_rcnn以及faster_rcnn,這些方法的網路結構一般都是被 roi pooling 層分成兩個子網路:

物體分類要求平移不變性越大越好 (影象中物體的移動不用區分),而物體檢測要求有平移變化。所以,imagenet 分類領先的結果證明盡可能有平移不變性的全卷積結構更受親睞。另一方面,物體檢測任務需要一些平移變化的定位表示。比如,物體的平移應該使網路產生響應,這些響應對描述候選框覆蓋真實物體的好壞是有意義的。cnn隨著網路深度的增加,網路對於位置(position)的敏感度越來越低,也就是所謂的translation-invariance,但是在detection的時候,需要對位置資訊有很強的的敏感度。

resnet 的**中提出了,一種使用 resnet 作為特徵引擎的 faster r-cnn 方法,將 roi pooling 層插在兩個卷積子網路之間。roi-wise 子網路越深,那麼對於有 n 個 proposal 的影象,那麼子網路就需要重複計算 n 次,雖然子網路越深,準確度可能越高,但是這應一定程度上是以犧牲訓練和測試的效率速度為代價的(這一塊我沒有了解的很清楚)。

針對上述的所提出的問題,下面介紹一下r-fcn的創新點:

為了解決translation variance 在檢測和分類中的衝突,這篇*****設計了一種特殊的卷積層:position-sensitive score maps作為全卷積網路的輸出,該卷積層輸出 position-sensitive 的 score map,而且每個 score map 引入了位置的資訊,如物體的頂部。在網路的最後一層,再接乙個 position-sensitive roi pooling 層完成對物體的檢測分類。在整個網路框架中,所有可學習的層,都是卷積層,同時把空間位置資訊引入特徵學習中,使得整個網路可以進行 end-to-end 的學習。(後面會詳細介紹position-sensitive score maps和position-sensitive roi pooling是怎麼操作的)。

**也是採用了比較流行的檢測策略,分為兩步:

學習筆記 雜湊學習筆記

hash基本原理 hash就是乙個像函式一樣的東西,你放進去乙個值,它給你輸出來乙個值。輸出的值就是hash值。一般hash值會比原來的值更好儲存 更小 或比較。那字串hash就非常好理解了。就是把字串轉換成乙個整數的函式。而且要盡量做到使字串對應唯一的hash值。它的主要思路是選取恰當的進製,可以...

學習筆記 CentOS 學習筆記01

簡單的做個課堂筆記 虛擬機器用的是vmware,系統是centos cd etc sysconfig network scripts pwdls 顯示列表 cat ifcfg eth0 檢視檔案內容 vi ifcfg eth0 進入vi編輯器 onboot no 原始設定 x逐字刪除 d刪除整行 a...

筆記 spring cloud 學習筆記

1 spring cloud 是什麼 spring cloud為開發人員提供了快速構建分布式系統中一些常見模式的工具 例如配置管理,服務發現,斷路器,智慧型路由,微 控制匯流排 分布式系統的協調導致了樣板模式,使用spring cloud開發人員可以快速地支援實現這些模式的服務和應用程式。他們將在任...