我們很容易得到rgb image,而depth image就沒那麼容易了。depth image的數量級也遠遠小於rgb image。某些利用depth image訓練的模型的精度在很大程度上也低於rgb image的精度。那麼這個問題可以怎麼解決呢?
以下幾種方案是比較典型的:
1、finetune rgb image model to the depth image model。
2、distill the rgb image to the depth image model。
由於有**說明方案2優於方案1,而且方案1比較簡單,沒什麼可說的。
這裡說下方案2,方案2主要參考的是《cross modal distillation for supervision transfer》
以下為pipeline ,值得一提的是depth image要經過處理為3通道的資料
至於怎麼將depth image處理為3通道的資料,具體可以參考這篇**《perceptual organization and recognition of indoor scenes from rgb-d images》以及《learning rich features from rgb-d images for object detection and segmentation》。
YUV格式到RGB格式的轉換
yuyv格式到rgb格式的轉換 yuyv格式如下 y0u0y1v0 y2u1y3v1.說明 乙個y代表乙個畫素,而乙個y和uv組合起來構成乙個畫素,所以第0個畫素y0和第乙個畫素y1都是共用第0個畫素的u0和v0。而每個分量y,u,v都是占用乙個位元組的儲存空間。所以y0u0y1v0相當於兩個畫素,...
RGB到HSV顏色空間的轉換
opencv預設讀取影象是rgb通道,現需要轉化到hsv hue,saturation,value 顏色空間,opencv提供cvtcolor c void cvtcolor inputarray src,outputarray dst,int code,int dstcn 0 函式對顏色空間進行轉...
YUYV格式到RGB格式的轉換
yuyv格式如下 y0u0y1v0 y2u1y3v1.說明 乙個y代表乙個畫素,而乙個y和uv組合起來構成乙個畫素,所以第0個畫素y0和第乙個畫素y1都是共用第0個畫素的u0和v0。而每個分量y,u,v都是占用乙個位元組的儲存空間。所以y0u0y1v0相當於兩個畫素,占用了4個位元組的儲存空間,平均...