最近讀了一篇關於lbp和dbn的文章,感覺思路挺好的,如有不當之處望指正!!!!!
這是一篇在非限制條件下,基於深度學習的人臉識別演算法。,將lbp紋理特徵作為深度網路的輸入,通過逐層貪婪訓練網路,獲得良好的網路引數,並用訓練好的網路對測試樣本進行**。
文章通過lbp提取非限制條件下人臉影象的紋理特徵並利用dbn進一步自動學習更抽象、更有效的人臉特徵,並在dbn頂層自動進行人臉分類。lbp所提取的人臉影象的區域性紋理特徵對光照和微小平移具有較強的頑健性,將其作為dbn輸入特徵更有助於網路對影象特徵分布的理解,進一步減少網路學習到不利的特徵描述;同時,通過dbn對輸入資料進行深度學習和自動特徵提取,並在網路最頂層實現特徵識別,有效避免了過多主動因素的干預。
文章idea:
提出lbp和dbn相結合的非限制條件下人臉識別,徵。將lbp與dbn相結合,克服了dbn不能學習到人臉影象區域性結構特徵的缺點,使得dbn學習到的抽象特徵受光照、微小平移等的影響較小。
dbn訓練步驟:
1)對第一層rbm,以lbp紋理特徵為輸入,對rbm進行無監督訓練,獲得該層最優的引數;
2)高層rbm以低一層rbm輸出資料為輸入,對rbm進行無監督,獲得rbm網路最優的引數值;
3)最後利用
全域性訓練的方法對訓練好的各層引數微調,使得
dbn收斂到全域性最優。該訓練方法繞過了全域性訓練
的複雜性,通過快速散度(cd,contrastive diber.gence)¨/j訓練rbm獲得dbn各層的最優引數,降低了學習目標過擬合的風險,使得網路具有更好的資料**能力。
演算法步驟
1)用雙線性內插法將測試樣本和訓練樣本降維至32×32,並進行直方圖均衡化等歸一化預處理。
2)對訓練樣本和測試樣本進行分塊並提取每個子塊的lbp紋理特徵,將每個子塊的特徵連線起來形成樣本的lbp紋理特徵。本文lbp紋理特徵提取時樣本分塊為4×5,半徑尺為1,畫素數p為8。此時所提取的lbp紋理特徵和畫素級特徵維數相當。
3)將訓練樣本的lbp紋理特徵作為dbn可視層輸入,對深度網路進行逐層訓練,以獲取最優網路引數。文中dbn層數選為2層:第1層學習率為0.002,迭代次數為40;第2層為0.003,迭代次數為40。
4)當深度網路訓練完後,將測試樣本的lbp紋理特徵作為dbn可視層輸入,利用優化後的網路由下向上多層次地學習和提取測試樣本的抽象特徵,在網路最頂層進行softmax回歸分類,獲得
實驗結果:
結果表示隨著隱藏單元數的增加,深度網路能夠更好地表達人臉影象特徵,但是網路的訓練時間和分類時間也隨之增加,計算量逐漸增大,因而對硬體要求也隨之提高。
。當訓練樣本數增加時,提取類別特徵較為豐富,演算法識別率劇增高
總之,。本文演算法在受姿態、光照、表情、遮擋等綜合因素影響的非限制條件下具有較好的識別效果,同時在受多種因素影響的yale庫和光照因素影響的yale—b庫上取得較高的識別率。
基於LBP的人臉識別技術
lbp介紹 得到lbp影象後,將影象切割成7 7 49塊 之所以要切成49小塊,是為了保留空間資訊,比如眼睛的位置資訊 嘴巴的位置資訊等等。對於每一小塊,統計其直方圖。注意,不需要統計0 255所有位置的直方圖,只需要對特定的58個位置進行統計 之所以選擇這58個位置,是因為這些位置迴圈跳變不超過兩...
LBP原理介紹與人臉識別
lbp local binary pattern,區域性二值模式 是一種用來描述影象區域性紋理特徵的運算元 它具有旋轉不變性和灰度不變性等顯著的優點。它是首先由t.ojala,m.pietik inen,和d.harwood 在1994年提出,用於紋理特徵提取。而且,提取的特徵是影象的區域性的紋理特...
人臉識別的深度學習
深度學習只不過是機器學習的標準範例,更準確地說 是其演算法之一。在最大程度上,它基於人腦的概念和神經元的相互作用。如果你開始谷歌搜尋深度學習是什麼,你會發現今天這個超級熱門詞遠遠不是新的。為什麼這樣?該術語本身出現在20世紀80年代,但到2012年,沒有足夠的力量來實施這項技術,幾乎沒有人關注它。在...