3.block中的拼接
梯度是在一副影象中尋找邊緣強度和方向的工具。梯度是用一階微分來實現的。先看下圖,梯度的表示。
梯度的大小是用如下公式表示的。
由於該公式下的計算會導致巨大的計算開銷,在多數情況下,是使用絕對值來近似平方和平方根的計算。該操作如下所示:
梯度的方向由以下公式表示:
需要注意的是,任意一點(x,y)處的乙個邊緣方向與該點處梯度向量的方向a(x,y)正交。如下圖所示:
從圖中我們可以看到,不管是灰度的突變區域,還是緩慢的過度區域,都能從一階微分中的數值中表現。符號表示亮與暗之間的過度方向。總結一句,一階微分的數值有無可以用來檢測某個點是否存在乙個邊緣處。hog就是利用了這個檢測邊緣特徵的性質來做相關的檢測。
首先我們需要做什麼預處理。一是灰度值的調節,二是降低雜訊。其中一,一般是由於拍攝環境或者攝影裝置使用不當,造成影象的過暴或者欠暴。
通過伽馬變換這種軟變換來彌補影象過暴或者欠暴的問題。
首先我們得明白導數對雜訊是極其敏感的,通過以下來說明:
其中第一列除了第一幅影象外,均新增了高斯雜訊。m表示均值,σ表示標準差。我們可以看到隨著雜訊的加大,邊緣特性在一階微分中的顯得越來越不明顯。邊緣一般是連續的,且波動不大的。但是在雜訊的干擾下,一階微分的結果波動加劇,最嚴重的情況下,可以說提取不到一點邊緣資訊。
可能都知道block在hog中的作用,1個block包括了多個cell,而且還會在影象中滑動囊括cell。通過block的歸一化處理,減少光照對影象過暴或欠暴的影響。
但是在cell形成block的過程中,本人將此過程想象成了簡單的拼接,如下圖所示
顯示不是這樣的,當然有相同的地方,那就是它們的幅值依舊是所在cell中得到的值,只需改動的是橫軸的座標。如下圖所示:
所以眾多的block可以形成一副的更多幅值的直方圖。如下圖標記處所示:
在形成hog的特徵描述子後,我們就可以得到中的眾多的特徵座標,如上圖標記處,就有4608個座標。然後將這些資料交給svm處理,分出多個超平面,不同的超平面對應著不同的特徵。
參考資料:
1.datawhale的計算機視覺基礎
2.岡薩雷斯,數字影象處理(第三版)
3.hog特徵詳解與行人檢測
Task04 HOG特徵描述運算元 行人檢測
本次任務將學習一種在深度學習之前非常流行的影象特徵提取技術 方向梯度直方圖 histogram of oriented gradients 簡稱hog特徵。hog特徵是在2005年cvpr的會議發表,在影象手工特徵提取方面具有里程碑式的意義,當時在行人檢測領域獲得了極大成功。學習hog特徵的思想也有...
CV Haar特徵描述運算元
1.3 案列 計算haar特徵值 1.4 特徵值歸一化 1.5 adaboost級聯分類器 2 python 實現 學習目標 haar特徵分為三類 邊緣特徵 線性特徵 中心特徵和對角線特徵,組合成特徵模板。特徵模板內有白色和黑色兩種矩形,並定義該模板的特徵值為白色矩形畫素和減去黑色矩形畫素和。haa...
HOG 目標檢測的特徵描述器之一
hog是 histogram of oriented gradient的縮寫,即方向梯度直方圖特徵,主要用於深度學習中的目標檢測與識別,是用來描述物體檢測的特徵描述子。最早由法國研究人員dalal在2005的cvpr上提出的,在該文中,作者利用hog與svm進行組合用來做行人檢測的任務,後來被廣泛應...