這篇文章其實和normface原理完全相同,只是推理的切入點稍微有點不同。兩篇**發表的時間也相近。因此博主就不再詳細寫分析了,如果有看得不太懂的可以參考我的normface閱讀筆記。
人臉識別系列(十四):normface
值得一提的是,這篇文章有乙個亮點就是在lfw上刷到了99.86%的成績,十分驚豔,讓人不得不佩服商湯科技的調參能力。
下面進入正題。
1.***** loss
假設 是樣本i,j的標籤,用c(x,y)表示x,y的余弦距離
為了提高類間差距,減小類內差距,先提出***** loss
文章中說理論上可以用,但是實際上計算複雜度是o(m2)所以用不了,但是我感覺理論上也不行,因為對於不同標籤的樣本損失直接歸零了
2.revised loss
假設 即ck是某個類的中心,那麼可以使用下面的revised loss
exp的作用是將余弦距離轉化為規範的概率輸出
3.進行特徵和類心的歸一化:
為什麼要歸一化:見normface一文
此處類心也不像上面寫的由統計得出,而是成為乙個可訓練的引數(這就變得和normface的softmax層一樣了)
損失函式寫為
還是原來的交叉熵
定理
假設我們要使總損失l不大於乙個數ε,網路共有k個類,那麼α必有下界
(絕了,和normface的公式一模一樣)
在minist和cifar-10上的錯誤率
網路結構:inception resnet網路,最後一層接128維的全連線層
訓練集:microsoft-1m 的乙個子集,一共越8w人 3m影象
訓練過程
a表示mnist,b表示ms-1m
lfw得分
順帶提一下
lfw test集合 6000 中只有10個樣本標錯了。
也就是說理論上最高accuracy是 1-(10/6000)=99.83%
也就是說有些方法已經超過了理論上的極限了
megaface
成績也不錯
人臉識別系列(八) VGGFace
本文主要內容有二 1 從零開始構建乙個人臉識別資料庫,一共 2.6m images,over 2.6k people,構建過 程主要是程式實現的,少量人工參與。2 通過對比各種cnn網路,提出了乙個簡單有效的cnn網路,在各種公開的人臉識別資料庫上得到很好的效果。構建過程主要分為5個階段 1階段在i...
人臉識別系列(二) DeepID1
其實deepid特徵就是乙個由連線第三層與第四層組成的全連線層特徵。第四層的特徵更加全域性化 global 第三層的特徵更加細節 因此deepid連線了兩者,以求同時包含全域性,細節資訊。通過5個landmarks將每張人臉劃分成10regions 每張提取60patches 10regions 3...
人臉識別 人臉庫
1.mit 影象集 美國,麻省理工學院 包括 16 人,每個人有不同光照 不同尺寸 不同角度的 27 張 2.feret 影象集 美 方 此影象集包含大量的人臉影象,並且每幅圖中均只有乙個人臉。該集中,同乙個人的 有不同表情,光照,姿態和年齡的變化。3.umist 影象集 英國,曼切斯特大學 20 ...