hog特徵-理解篇
原創rachel-zhang 發布於2012-03-18 08:44:06 閱讀數 106194 收藏
展開網上去找關於hog的資料,發現理解性的較少,而且較為冗長,為方便大家理解便自己寫了篇,希望能對奮鬥在特徵提取第一線的同志們有所幫助:
hog特徵原理:
hog的核心思想是所檢測的區域性物體外形能夠被光強梯度或邊緣方向的分布所描述。通過將整幅影象分割成小的連線區域(稱為cells),每個cell生成乙個方向梯度直方圖或者cell中pixel的邊緣方向,這些直方圖的組合可表示出(所檢測目標的目標)描述子。為改善準確率,區域性直方圖可以通過計算影象中乙個較大區域(稱為block)的光強作為measure被對比標準化,然後用這個值(measure)歸一化這個block中的所有cells.這個歸一化過程完成了更好的照射/陰影不變性。
與其他描述子相比,hog得到的描述子保持了幾何和光學轉化不變性(除非物體方向改變)。因此hog描述子尤其適合人的檢測。
通俗的講:
hog特徵提取方法就是將乙個image:
1. 灰度化(將影象看做乙個x,y,z(灰度)的三維影象)
2. 劃分成小cells(2*2)
3. 計算每個cell中每個pixel的gradient(即orientation)
4. 統計每個cell的梯度直方圖(不同梯度的個數),即可形成每個cell的descriptor
再小談下hog、sift與pca-sift的應用與區別:
hog沒有旋轉和尺度不變性,因此計算量小;而sift中每個feature需要用128維的向量來描述,因此計算量相對很大。
那麼行人檢測中怎麼應用hog呢?
對於解決rotation-invariant 的問題:建立不同方向的模版(一般取15*7的)進行匹配
總的來說,就是在不同尺度上的影象進行不同方向的模板(15*7)匹配,每個點形成乙個8方向的梯度描述。
sift由於其龐大計算量不用與行人檢測,而pca-sift的方法過濾掉很多維度的資訊,只保留20個主分量,因此只適用於行為變化不大的物體檢測。
method
time
scale
rotation
blur
illumination
affine
sift
common
best
best
common
common
good
pca-sift
good
good
good
best
good
best
surf
best
common
common
good
best
good
關於sift的其他講解:
HOG特徵 理解篇
本文 網上去找關於hog的資料,發現理解性的較少,而且較為冗長,為方便大家理解便自己寫了篇,希望能對奮鬥在特徵提取第一線的同志們有所幫助 hog特徵原理 hog的核心思想是所檢測的區域性物體外形能夠被光強梯度或邊緣方向的分布所描述。通過將整幅影象分割成小的連線區域 稱為cells 每個cell生成乙...
HOG特徵 理解篇
網上去找關於hog的資料,發現理解性的較少,並且較為冗長,為方便大家理解便自己寫了篇,希望能對奮鬥在特徵提取第一線的同志們有所幫助 hog特徵原理 hog的核心思想是所檢測的區域性物體外形可以被光強梯度或邊緣方向的分布所描寫敘述。通過將整幅影象切割成小的連線區域 稱為cells 每乙個cell生成乙...
HOG特徵理解
hog histogram of oriented gradient 表示的是影象區域性方向梯度直方圖,主要用來進行複雜影象中的行人檢測,並且比較通用的模型是hog svm。基本思想 在影象中,區域性區域的特徵能夠 被梯度或邊緣的方向密度資訊很好的表示 本質就是邊緣的梯度資訊 思想思路 將待分析影象...