人臉識別筆記（1）

最早期的人臉識別方法包括尋找區分性影象特徵的位置，如眼睛、鼻子和嘴，並測量這些特徵位置之間的距離（1973；1977；1991）；

近期的方法依賴於比較灰度影象在被稱為「特徵臉（1990）」的低維空間的投影並利用活動表觀模型對形狀和表觀變化（而忽略姿態變化）進行聯合建模。

狹義人臉識別指的是：首先採用人臉檢測和特徵定位對所有人臉進行對齊，然後裁剪出眉眼鼻嘴形成的核心人臉區域，之後從中提取人臉特徵進行儲存或與已知人臉的特徵進行相似度計算的過程。

裡面的核心是「如何提取具有區分能力的特徵」，2023年以來，採用深度卷積神經網路進行特徵學習已經成為人臉識別領域的標準技術。

目前這方面主要的進步還是來自更大規模實戰資料。對於一些難以獲取大量資料的場景，研究人員也在想法設法採用半自動或自動的方法「增廣」資料集，包括基於三維人臉模型合**臉或者採用gan這類方法生成資料，這裡的3d人臉模型既可能是採用專用裝置採集的，也可能是採用3d mm等方法自動重建的。值得注意的是，儘管gan很火熱，也能合成出一些視覺效果不錯的人臉影象，但其合成的增廣人臉資料是否能夠用來增廣特定人的資料並提高特徵學習的效果，目前尚不得而知。此外，面向移動終端和嵌入式應用等實際應用需求，也有大量工作是進行模型壓縮和計算加速的。

人臉識別有很多應用場景，不同場景的成熟度差異很大。

1. 第一種場景，1:1 的人證合一驗證系統。

典型的應用是：刷身份證讀取卡內**，將其與現場採集的使用者人臉去做比對，看是否身份證的合法持有人。這個任務在三四年前大多數人臉識別專家還認為幾乎是不可能完成的任務，但就在最近一兩年，通過上萬甚至幾十萬人此類應用資料的訓練，在被識別人配合的情況下，最好的系統已經可以在0.01%的誤識率時達到95%以上的正確驗證率。也就是說，一萬個人來冒充某個人a，只有乙個可以冒充成功，而a本人在95%的情況下可以被正確識別出來。如果允許誤識率更高一些，比如到0.1%，識別率甚至可以進一步提高到99%以上（對配合使用者）。這種場景還是1:1驗證中最有挑戰性的：因為身份證卡內**只有102*126畫素，而且被壓縮成了1k位元組儲存在身份證內，而且其中人臉已經有多年的老化。

2. 第二種場景，1:n靜態**比對系統。

典型應用場景是公安人員對不明身份嫌疑人**進行公安大庫**比對，以確定其身份。這種應用甚至在幾年前就已經基本成熟，當n為千萬甚至數億量級條件下，首選識別率可以做到90%或更高，需要注意的是，區別於後面要提到的1:n+1場景，這類1:n場景不需要設定拒識率。這方面，我們的人臉識別技術在幾年前就已經被合作夥伴上海銀晨科技產業化，應用於護照人臉和多個省公安廳的大庫比對中，並取得了相當多的實戰成功案例。就在最近，學術界也出現了大規模人臉識別測試庫megaface，其中人臉數量達到了100萬規模，megaface主要是生活照或新聞照，所以難度要更大一些。

3. 第三種場景是1:n+1動態人臉識別場景。

區別於前面的1:n場景，這類場景是需要拒識非目標人的，所以是n+1。這種場景實際上還可以細分為三類：目標人配合場景（比如無卡考勤或門禁），目標人不配合場景（比如黑名單卡口人臉布控），以及處於二者之間的、被識別人既不配合也不刻意迴避的場景（比如vip識別系統）。不妨分別稱之為a場景，c場景和b場景。

這三類場景的技術成熟度差別很大：在n等於10000人、誤識率不高於1%時，a場景識別率可以做到98%以上，b場景可以做到70%~90%，c場景恐怕只能做到80%以下，某些條件下甚至可能低的不忍直視。需要特別強調的是，這裡誤識率1%看起來有點高，但在n等於1萬人時，大概相當於1:1場景下的百萬分之一的誤識率，實際上已經非常有挑戰了。

近年來人臉識別的進步是有目共睹的，但人臉識別遠不是乙個已經解決了的問題，它還存在如下一些問題：

1. 在開放環境下，如何確保識別的魯棒性的問題

例如，即使目前最好的系統，恐怕也還做不到在家庭環境下，讓乙個矮小的機械人隨時隨地準確地識別出乙個家庭的5-6個成員，這涉及到視角、光照、距離、遮擋等等諸多因素帶來的魯棒性問題。

2. 人臉防騙技術

這是一場魔高一尺、道高一丈的博弈「遊戲」，風險確實是存在的，儘管可能並沒有央視報道的那麼誇張。

3. 黑名單動態布控系統

對於人臉識別最大的實戰應用場景，即黑名單動態布控系統，也就是前面所說的3c場景，目前n等於1萬人，錯誤接收率等於1%，條件較好的時候首選識別率可以做到80%左右。但實際需求是在開放監控場景下，n等於100萬人，誤識率要求低於0.01%，甚至要對各種試圖逃避識別的目標人達到首選識別率90%以上——這是極具挑戰的任務，難度比現在能做到的要高4~5個數量級。是否能在兩三年內做到我個人持謹慎的懷疑態度，這個過程中工業界需要保持冷靜，避免因過度承諾而失去使用者信任，帶來人臉識別應用的「倒春寒」。

簡單總結一下：

1. 學術界的挑戰

從學術界來講，人臉識別研究已經進入了乙個「無所適從」的歷史階段，我們希望不要把我們自己從碼農變成數工，但事實上新方法能帶來的增益短期內難以抗衡工業界用大資料帶來的效能增益，甚至導致了工業界技術上的「領先」，這一點大家去看lfw和fddb之類競賽的結果就可以明顯地看出這個趨勢。

2. 學術界的機會

而因為商業原因，學術界對工業界的實際進展難以把控。當然，學術界的機會恰恰在工業界不願意關注的地方，比如在資料少甚至沒有標註資料的情況下，如何可以仍然有效的學習模型？在有資料但資料髒亂差的情況下如何魯棒的訓練模型？

總之，人臉識別作為計算機視覺領域最落地的技術之一，是cv技術應用的排頭兵，確實已經引爆了眾多使用者對計算機視覺應用的濃厚興趣，這或許是更值得我們欣喜的。

人臉識別筆記（1）

人臉識別學習筆記 1

人臉識別（筆記）

人臉識別學習 1

人臉識別筆記（1）

人臉識別學習筆記 1

人臉識別（筆記）

人臉識別學習 1

相關推薦