stn運算元 深度學習常用運算元(二)

2021-10-17 01:53:55 字數 1803 閱讀 6894

1、tensor維度變換

1)flatten

作用:將輸入tensor中從start_axis維度到end_axis維度合併為1維

2)reshape

作用:將輸入tensor描述轉換為新的shape

3)freespaceextract

作用:將h維變成1,其他維度不變,從而完成對h的取樣,取樣值所在位置由輸入的index引數決定

4)pack

作用:pack運算元為tensorflow原生運算元,最新的版本已經改名為:stack。該運算元以指定的軸axis,將乙個維度為r的張量陣列轉變成乙個維度為r+1的張量。

5)pad

作用:進行資料擴充

6)permute

作用:調整tensor的輸入維度順序

7)shufflechannel

作用:調整c維的排序

使用網路:shufflenet

8)title

作用:將輸入資料在每個維度上覆制指定次數來生成輸出資料

2、tensor單個元素運算

1)rsqrt

公式:y = 1 / sqrt

2)scale

公式:y(x)=scale*x+bias

3)absval

公式:y(x)=|x|

4)power

公式:f(x)= (scale * x + shift) ^ power

3、分類

softmax

公式:作用:通常作為分類網路的最後一層,輸出每類的概率

4、畫框

1)clipboxes

作用:將輸入的框座標限制在[0,img_w-1]和[0,img_h-1]之間。

2)decodeboxes

作用:將輸入框的長寬座標轉換為描點座標(框中心點座標和長寬),然後進行修正,修正後再替換回長寬座標

3)detectpostprocess

作用:(1)對輸入的框進行修正;

(2)按照得分進行排序;

(3)使用nms進行過濾;

(4)每個分類取前n個框輸出。

4)fasterrcnnpredictions

作用:獲取得分最高的n個框,需要進行nms處理。

使用網路:maskrcnn

5)fsrdectionoutput

作用:獲取得分最高的n個框,需要進行nms處理

輸入資料:每個分類的得分資料、roi座標、roi偏移、feature map的長和寬

使用網路:fasterrcnn

6)generaterpnproposals

作用:根據輸入rois座標和得分,輸出排序和nms處理後的前n個框,框座標形式為左上角和右下角

使用網路:mask rcnn

7)proposal

特點:對特徵圖上的每個點,生成scale*ratio個固定大小的視窗;即候選視窗是該運算元生成的。

8)ssddetectionoutput

作用:用來生成**框相對原圖的真實座標,並對所有**框進行過濾,得到最終物體檢測的結果。輸出的每個**框的資訊包括image id ,lable, confidence以及四個座標值。

使用網路:ssd

8)ssdpriorbox

作用:生成預選框

使用網路:ssd

5、拼接

concat:實現多個運算元的拼接

6、旋轉/縮放/平移/剪下

spatial transform

作用:在cnn之前對feature map進行旋轉、縮放、平移、剪下等操作

使用網路:spatial transformer networks(stn)

深度學習常用運算元(一)

1 起始輸入 data 輸入資料第一層 2 啟用運算元 作用 引入非線性 通常需要區分的區域,直線是無法完全區分的 公式 relu x max 0,x 2 leakyrelu 公式 leakyrelu x x 0 x x negative slope 3 relu6 公式 leakyrelu x m...

Spark 常用運算元

官網rdd操作指南 2 key value資料型別的transfromation運算元 三 連線 3 action運算元 val list list 1 2,3 sc.parallelize list map 10 foreach println 輸出結果 10 20 30 這裡為了節省篇幅去掉了換...

Halcon學習筆記(二) 運算元學習

填充區域 fill up fill up shape 二者區別在於後者針對面積大小範圍來決定是否填充 區域聯合 union1 union2 skeleton 返回乙個區域的框架 get region runs 訪問乙個區域的遊程編碼 partition dynamic 在較小垂直範圍內水平劃分區域 ...