人臉識別基礎

2021-09-24 03:59:40 字數 1725 閱讀 8091

最近對人臉識別感興趣,網上找了個閱讀清單一點點開始看

《blessing of dimensionality: high-dimensional feature and its efficient compression for face verification》,簡稱high lbp(0.9517),深度學習演算法前比較經典的演算法。對影象分塊,各種overlap,最後把lbp特徵堆積起來(維度10w+),經行lda、pca處理,然後計算距離。

joint basyesian:《 bayesian face revisited: a joint formulation 》簡稱joint bayesian(0.9242),用的是最大化後驗概率的方法,其中公式筆者記得以前推了好久,不詳細介紹。目前有很多在深度學習提取特徵之後繼續用joint bayesian提高的方法。

《 deepface: closing the gap to humal-level performance in face verification 》,簡稱deepface(0.9735)。facebook基於3d人臉模型的設計,400w的人臉訓練資料對當時來說也是屬於海量資料了,也讓業界清晰的認識到,來吧,推資料吧!

deepid三部曲系列,重點是《deepid3: face recognition with very deep neural networks》,簡稱deepid3(0.9745),用到了vgg和googlenet的網路結構。

《 facenet: a unified embedding for face recognition and clustering 》 簡稱facenet,facenet的核心思想來說就是triplet loss。

《 large-margin softmax loss for convolutional neural networks 》簡稱l-softmax,在softmax上進行處理,目的是讓不同類分的更開。

《 sphereface: deephypersphereembeddingfo***cerecognition 》簡稱a-sodtmax,是在l-softmax上的改進。a-softmax loss簡單講就是在large margin softmax loss的基礎上新增了兩個限制條件||w||=1和b=0,使得**僅取決於w和x之間的角度。 

最重要的resnet筆者沒有單獨列出來,畢竟resnet是通殺的,筆者就不刻意介紹。介紹了這麼多,其實筆者認為最重要的還是資料。大量的資料加上resnet加上center loss 或是 其他loss實驗,效果不會差,剩下的細節就是各位在煉丹中的經驗和trick了。

《cosface: large margin cosine loss for deep face recognition》面向深度人臉識別的增強邊緣余弦損失函式設計。人臉識別的核心任務包括人臉驗證和人臉辨識。然而,在傳統意義上的深度卷積神經網路的softmax代價函式的監督下,所學習的模型通常缺乏足夠的判別性。 

為了解決這一問題,近期一系列損失函式被提出來,如center loss,l-softmax,a-softmax。所有這些改進演算法都基於乙個核心思想:增強類間差異並且減小類內差異。 

在本文中,作者從乙個新的角度來解決這個問題,並設計了乙個新的損失函式,即增強邊緣余弦損失函式(lmcl)。更具體地說,通過對特徵向量和權向量的l2歸一化,把softmax損失函式轉化為余弦損失函式,這樣做消除了半徑方向的變化,並在此基礎上引入了乙個余弦邊界值m來進一步最大化所學習的特徵在角度空間的決策間距。因此,採用這種歸一化和增強余弦決策邊距的方法,能夠更有效的起到最大化類間差異和最小化類內差異的作用。 

人臉識別 人臉庫

1.mit 影象集 美國,麻省理工學院 包括 16 人,每個人有不同光照 不同尺寸 不同角度的 27 張 2.feret 影象集 美 方 此影象集包含大量的人臉影象,並且每幅圖中均只有乙個人臉。該集中,同乙個人的 有不同表情,光照,姿態和年齡的變化。3.umist 影象集 英國,曼切斯特大學 20 ...

人臉識別之人臉檢測

人臉識別分為人臉檢測 人臉預處理 蒐集和學習人臉以及人臉識別四個部分,此部分將人臉檢測。本文基於opencv進行的。在opencv中常用的人臉檢測器有基於lbp的特徵檢測 基於haar的特徵檢測,兩者的區別 前者比後者快好幾倍且不需要許可協議,但很多haar檢測器需要許可協議。基於haar的臉部檢測...

人臉識別API 人臉比對

api協議說明 路徑 輸入引數 字段型別 描述seq可選 string 會話序號 非必填 imga string 資料 base64編碼 原始建議小於3m,格式限定為jpg bmp png三種格式 imgb string 資料 base64編碼 原始建議小於3m,格式限定為jpg bmp png三種...