梯度直方圖特徵(hog)
是一種對影象區域性重疊區域的密集型描述符
, 它通過計算區域性區域的梯度方向直方圖來構成特徵。
hog特徵結合
svm分類器已經被廣泛應用於影象識別中,尤其在行人檢測中獲得了極大的成功。需要提醒的是,
hog+svm
進行行人檢測的方法是法國研究人員
dalal
在2005
的cvpr
上提出的,而如今雖然有很多行人檢測演算法不斷提出,但基本都是以
hog+svm
的思路為主。
hog特徵是一種區域性區域描述符
,它通過計算區域性區域上的梯度方向直方圖來構**體特徵
,能夠很好地描述人體的邊緣。它對光照變化和小量的偏移不敏感。
影象中畫素點(x,y)
的梯度為
dalal提出的hog特徵提取的過程:把樣本影象分割為若干個畫素的單元(cell
),把梯度方向平均劃分為9
個區間(
bin),在每個單元裡面對所有畫素的梯度方向在各個方向區間進行直方圖統計,得到乙個
9維的特徵向量,每相鄰的
4個單元構成乙個塊(
block
),把乙個塊內的特徵向量聯起來得到
36維的特徵向量,用塊對樣本影象進行掃瞄,掃瞄步長為乙個單元。最後將所有塊的特徵串聯起來,就得到了人體的特徵。例如,對於
64*128
的影象而言,每
2*2的單元(
16*16
的畫素)構成乙個塊,每個塊內有
4*9=36
個特徵,以
8個畫素為步長,那麼,水平方向將有
7個掃瞄視窗,垂直方向將有
15個掃瞄視窗。也就是說,
64*128
的,總共有
36*7*15=3780
個特徵。
在行人檢測過程中,除了上面提到的hog特徵提取過程,還包括彩圖轉灰度,亮度校正等步驟。總結一下,在行人檢測中,hog特徵計算的步驟:
(1)將輸入的彩圖轉換為灰度圖;
(2)採用gamma
校正法對輸入影象進行顏色空間的標準化(歸一化); 目的是調節影象的對比度,降低影象區域性的陰影和光照變化所造成的影響,同時可以抑制噪音的干擾;
(3)計算梯度;主要是為了捕獲輪廓資訊,同時進一步弱化光照的干擾。
(4)將梯度投影到單元的梯度方向;目的是為區域性影象區域提供乙個編碼,
(5)將所有單元格在塊上進行歸一化;歸一化能夠更進一步對光照、陰影和邊緣進行壓縮,通常,每個單元格由多個不同的塊共享,但它的歸一化是基於不同塊的,所以計算結果也不一樣。因此,乙個單元格的特徵會以不同的結果多次出現在最後的向量中。我們將歸一化之後的塊描述符就稱之為hog
描述符。
(6)收集得到檢測空間所有塊的hog
特徵;該步驟就是將檢測視窗中所有重疊的塊進行
hog特徵的收集,並將它們結合成最終的特徵向量供分類使用。
HOG演算法 行人檢測
hog histogram of oriented gridients 是2005年提出描述行人特徵的演算法,在當年取得了突破性的進展,處理在行人檢測領域,在其他識別方面hog也取得了不錯的效果。hog通過計算和統計影象區域性區域的梯度方向直方圖來形成描述特徵 在一張影象中,人與外界存在乙個邊緣,通...
Task04 HOG特徵描述運算元 行人檢測
本次任務將學習一種在深度學習之前非常流行的影象特徵提取技術 方向梯度直方圖 histogram of oriented gradients 簡稱hog特徵。hog特徵是在2005年cvpr的會議發表,在影象手工特徵提取方面具有里程碑式的意義,當時在行人檢測領域獲得了極大成功。學習hog特徵的思想也有...
基於Hog特徵的行人檢測
1 先建立相應的txt檔案 f pedestrian image 00000101 0.png f pedestrian image 00000105 0.png f pedestrian image 00000108 0.png f pedestrian image 00000110 0.png ...