深度學習 多尺度的理解

2021-10-01 04:06:08 字數 401 閱讀 9645

多尺度訓練這個問題應該是可以分為兩個方面:乙個是影象金字塔,乙個是特徵金字塔吧。

1、人臉檢測的mtcnn就是影象金字塔,使用多種解析度的影象送到網路中識別,時間複雜度自然就很高,畢竟每幅圖都要用多種scale去檢測。

2、像fpn特徵金字塔網路,是在多個feature map上面識別的話,但是是一次影象輸入完成的,所以只是識別時間會稍微長一些,時間複雜度並不會增加吧。

3、faster rcnn多個anchor帶來的多種尺寸的roi這種是不是也可以算muti scale?

4、faster rcnn訓練的時候,rpn和roi head網路的訓練資料都不是簡單的隨機選取的啊,是通過計算iou來根據正負樣本數量和比例來選取的哇。先經過rpn粗略選取之後再使用roi head網路做矯正,效果一般是要好於yolo v1和ssd啊

多尺度 理解

1.比如有一幅影象,裡面有房子有車有人,在這整張圖上提取特徵,提取的是全域性的特徵 現在,擷取影象的一部分,比如擷取汽車的部分,並將其放大至與原圖相同的尺寸,在此時擷取後放大的圖上提取特徵,提取的是整幅影象中某一部分的詳細特徵。2.或者,例如在進行卷積時,如圖 隨便截的圖 分別提取出第 三 四 五層...

尺度空間的理解

不從數學上來推倒什麼是尺度空間,只是從生活常識方面來解釋尺度空間的意義,意義懂了,數學方面自然就好理解了。好。首先我們提出乙個問題,請看下面的,讓我們我們人為的判斷下所顯示的左右中哪個的角尖銳?接下來我們慢慢的分析,在這其中我們會發現很有意思的事情。分析 圖1 a 中,顯然右邊的角更尖銳,這是因為同...

ISP Matlab 多尺度的細節增強

參考文獻 讀入 fid case1 test.bmp img in imread fid figure,imshow img in title 1 img in double img in m,n,d size img in 演算法引數配置 endorder 2 rad 3 h fspecial g...