dct變換利用傅利葉變換的性質。採用影象邊界褶翻將像變換為偶函式形式, 然後對影象進行二維傅利葉變換,變換後僅包含余弦項,所以稱之為離散余弦 變換。dct編碼屬於正交變換編碼方式,用於去除影象資料的空間冗餘。變換 編碼就是將影象光強矩陣(時域訊號)變換到係數空間(頻域訊號)上進行處理的 方法。在空間上具有強相關的訊號,反映在頻域上是在某些特定的區域內能量 常常被集中在一起,或者是係數矩陣的分布具有某些規律。影象經dct變換以 後,dct係數之間的相關性就會變小,而且大部分能量集中在少數的係數上。
1、二維離散余弦變換
在傅利葉級數展開式中,如果展開的函式是實偶函式,那麼,其傅利葉技術中只包含余弦項,在將其離散化由此可匯出余弦變換。
2、離散余弦變換的矩陣演算法
將影象從rgb空間對映到ycbcr空間。並把整幅影象或影象的一部分分成64塊(每塊的尺寸為(w/8)*(h/8),其中w為影象的寬度,h為影象的高度),計算每一塊中多有畫素各顏色分量(y、cb、cr)的平均值,並以此作為該塊的代表顏色。
對8*8塊的平均值資料進行dct變換(其中n=8),得到一系列係數。這裡,8*8的dct係數矩陣c[8][8]可以從8*8的代表顏色矩陣d[8][8]計算得到。經過變換,得到對應y、cb、cr顏色分量的三組dct係數矩陣c[8][8],分別是:yc[8][8]、cbc[8][8]、crc[8][8]。
對係數矩陣進行量化,量化後的係數通過「之」字形掃瞄,得到顏色布局描述符的值ycoeff、cbcoeff和crcoeff。
實際上,dct將8*8影象塊變換為頻率域時數值集中在矩陣的左上角(其中,第0行第0列的係數為dc係數,其餘63個係數為ac係數),低頻分量包含了影象的主要資訊,而高頻與之相比就不那麼重要了。根據設定的係數個數,提取相應資料。
係數取不同個數時對應的ycoeff、cbcoeff、crcoeff的所取得係數個數
number of coefficients
ycoeff
cbcoeff
crcofeff53
1193
33126
33186
634515
1515
colorlayoutextractiontool(int numycoef, int numccoef);
int colorlayoutextractiontool::setsourcemedia(momvop* img);
colorlayoutdescriptor* colorlayoutextractiontool::getdescriptor(void);
unsigned
long colorlayoutextractiontool::extract(momvop *img, int numberofycoeff, int numberofccoeff);
MPEG 7描述子 4 顏色結構描述子CSD
顏色結構描述符是乙個顏色特徵描述符,它既包括顏色內容資訊 類似於顏色直方圖 又包括內容的結構資訊。其主要功能是影象與影象的匹配,一般用於靜態影象檢索。它通過由幾個影象取樣組成的結構元素,表達了一幅影象中區域性顏色結構資訊,雖然它與顏色直方圖相關,但並不相同 不是突出某種顏色個別影象取樣的相對頻數,而...
MPEG 7 視覺描述符
本文節選自 基於mpeg 7與內容的影象檢索技術的研究 mpeg 7 標準中視覺描述工具包括基本結構和描述符。本文主要介紹各描述符。1 顏色描述符 mpeg 7 主要定義了七種顏色描述符 顏色空間 主顏色 顏色的量化 顏色直 方圖 顏色布局 gof gop 顏色 顏色結構 對顏色的特徵和結構進行描述...
ORB 特徵描述子
在常規立體匹配中特徵點匹配一直是研究重點,特徵點的描述是立體匹配的前提,orb特徵優點是速度快和較高的精度。rb 特徵亦由關鍵點和描述子兩部分組成。它的關鍵點稱為 oriented fast 是 一種改進的 fast 角點。它的描述子稱為 brief binary robust independen...