深度學習 秒懂人臉識別,適合科普

2021-10-08 19:26:58 字數 2311 閱讀 6385

常見的業務場景:安檢、打卡、刷臉支付等需要基於人臉進行身份識別的場合。當然,身份識別除了人臉識別外還包括指紋識別、虹膜識別等。

便捷:生物特徵,不像身份證等需要攜帶

非強制:不需要物件配合,拍攝到人臉即可,這一點是其能夠在安防領域發揮作用的重要原因

非接觸:無需與裝置直接接觸,避免傳染病等

檢測出中人臉所在的位置,於是可以將人臉裁剪切來,避免背景對身份識別產生干擾難點

但是高寬比上比通用物體檢測要友好些 ,人臉檢測具有較小的比率變化,1:1到1:1.5。

經典演算法

早期演算法

特徵提取(haar-like,hog…)+分類器(svm,adaboost…)

深度學習

介紹幾種效果比較好的

retinaface

一種single-stage人臉檢測框架,利用了強監督和自監督訊號的多工損失,提出了一種可檢測密集人臉的檢測方法。

共4部分損失包括:

常見的(1)分類交叉熵損失和(2)bbox回歸損失

(3)人臉五點關鍵點偏移量損失

(4)自監督分支簡單來說,就是將2d的人臉對映到3d模型上,再將3d模型解碼為2d,然後計算經過編譯碼的和原始的差別。中間用到了圖卷積。

mtcnn

一種三階段級鏈結構,同時實現人臉檢測和對齊的演算法。

演算法框架:

(0)預處理:將原圖resize到多種不同解析度大小,分別輸入網路

(1)stage-1:proposal network (p-net) 生成候選框&邊框回歸

(2)stage-2:refine network (r-net) 篩選候選框&邊框回歸

(3)stage-3:output network (o-net) 篩選候選框&人臉五點位置回歸

損失:(1)二分類的交叉熵損失(2)邊框回歸損失l2 loss(3)人臉五點位置損失l2 loss

m in

∑i=1

n∑j∈

det,

box,

land

mark

αjβi

jlij

min\sum^n_}}

mini=1

∑n​j

∈det

,box

,lan

dmar

k∑​α

j​βi

j​li

j​p-net和r-net中,關鍵點的損失權重α

αα要小於o-net部分,因為前面2個stage重點是過濾非人臉bbox。β

ββ的作用是,當輸入為非人臉時,只計算分類損失,而不計算回歸和關鍵點的損失。

訓練:用了ohsm (online hard sample mining),負樣本按loss降序排序後,取前70%參與訓練。

人臉對齊一般包括了人臉關鍵點檢測和人臉矯正。

應用難點

姿態、光照、遮擋、複雜表情等

演算法技術實現上分(1)生成式方法(2)判別式方法。

有興趣的可以取查閱,本人暫不涉及此方面內容,此處不展開。

基於人臉檢測和對齊後得到的人臉影象進行特徵提取。可通過cnn將人臉影象進行編碼。為得到區分效能(類內差異小、類間差異大)更好的特徵向量,對loss進行了很多的優化,可以參考人臉識別loss

根據需求,通常有兩種方法;

(1)1:1驗證

(2)1:n檢索

1:1驗證

常見場景,身份驗證。比如高鐵檢票口的刷臉,驗證身份證後系統會呼叫儲存的標準人臉,同攝像頭獲取的人臉進行比對,從而驗證身份。

1:1驗證中除了可以用上述提取的特徵進行相似度比對外,孿生網路也是常用的方法。

1:n檢索

1:n檢索則是在海量的人像資料庫中找出當前使用者的人臉資料並進行匹配,主要應用場景有安防等。

檢索就是計算輸入人臉同所有人臉的相似度(如余弦距離),然後找相似度最大的。這樣直接找通常稱為暴力檢索

如果n的量級非常大,則暴力檢索不在適合!需要進行近似檢索

簡單是說,就是先將庫中資料進行聚類,得到聚類中心,檢索的時候先找聚類中心,然後再去檢索該類下的人臉。

人臉識別的深度學習

深度學習只不過是機器學習的標準範例,更準確地說 是其演算法之一。在最大程度上,它基於人腦的概念和神經元的相互作用。如果你開始谷歌搜尋深度學習是什麼,你會發現今天這個超級熱門詞遠遠不是新的。為什麼這樣?該術語本身出現在20世紀80年代,但到2012年,沒有足夠的力量來實施這項技術,幾乎沒有人關注它。在...

人臉識別的深度學習

深度學習只不過是機器學習的標準範例,更準確地說 是其演算法之一。在最大程度上,它基於人腦的概念和神經元的相互作用。如果你開始谷歌搜尋深度學習是什麼,你會發現今天這個超級熱門詞遠遠不是新的。為什麼這樣?該術語本身出現在20世紀80年代,但到2012年,沒有足夠的力量來實施這項技術,幾乎沒有人關注它。在...

LBP 和深度學習,人臉識別

最近讀了一篇關於lbp和dbn的文章,感覺思路挺好的,如有不當之處望指正!這是一篇在非限制條件下,基於深度學習的人臉識別演算法。將lbp紋理特徵作為深度網路的輸入,通過逐層貪婪訓練網路,獲得良好的網路引數,並用訓練好的網路對測試樣本進行 文章通過lbp提取非限制條件下人臉影象的紋理特徵並利用dbn進...