人臉識別是怎麼識別的?為什麼需要大資料?(原理篇)

2021-09-23 20:43:51 字數 2706 閱讀 1123

2019-05-27 06:40:46

引言

如今,人臉識別和大資料是很熱門的行業,那麼計算機是如何識別人臉的?為什麼又需要大資料?本文將討論這些問題。

*因為知識有限,並且人臉識別也一直更新發展中,可能牛頓時代,他認為他的理論是完美的,但是到了愛因斯坦時代,其認為的「完美」已經有了缺陷。同樣,本文介紹的內容內容,隨著計算機技術的發展,也許有侷限性,但是對了解相關原理,仍具有一定的參考價值。
1.識別物體邊緣首先看一下下面這種,如果問你,這是什麼?你第乙個感覺這是乙個美女。

但是,請繼續看下面這張,雖然只是「寥寥幾筆」,你仍然能夠感覺說這是乙個「美女」,而是能判斷此圖和上面是「一樣的」

為什麼會這樣?這是因為研究發現,人的視覺細胞對物體的邊緣特別敏感。也就是說,我們先看到物體輪廓時,大腦會主動根據「以往存在大腦裡的物體」進行自動「對號入座」,然後判斷這東西到底是什麼。

因此識別物體,最主要的識別物體的邊緣或者叫做輪廓。

2.識別物體資料比對

物體識別其實包括兩個步驟:提取物體和識別物體。因為習慣的原因,我們通常會把這2個步驟合稱為物體識別。

這就像別人說壓縮rar檔案發給我一樣,壓縮rar其實是有2個步驟:首先是把所有檔案放到乙個檔案裡,然後再把這乙個檔案壓縮,但是我們已經習慣通稱為壓縮。

提取物品就是上面說的提取物體輪廓,而識別物體早期多採用預定義方式實現。什麼意思呢?簡單的說,如何定義這只動物是乙隻「鴨子」?

那麼就把鴨子的特徵列出來:

(1)鴨子有2條腿

(2)鴨子有2只眼睛

(3)鴨子的羽毛是白的

好吧,你可以把鴨子的主要「特徵」列出來,然後把你要驗證的和你預定義的「特徵」相比較,如果符合,就把這個物體當做「鴨子」。

這種識別動物的方式,有非常大的缺陷,例如下圖,你可能把鴿子識別為鴨子。

當然,你可以繼續給「鴨子」增加預定義,例如鴨子的「嘴」是扁的來排除鴿子,這仍然不完美,例如給你乙隻「鵝」呢?

3.特徵點識別

由於採用預定義方式識別有缺陷,現如今識別主要採用特徵點識別。一幅總存在著其獨特的畫素點,這些點我們可以認為就是這幅影象的特徵,成為特徵點。計算機視覺領域中的很重要的影象特徵匹配就是一特徵點為基礎而進行的。

例如下圖這個「人」,這個人的定義既不是說他有鼻子有眼就是人,也不是定義他有頭髮有牙齒才是人,而是計算機自動提取這種的某些特徵點,而「這些特徵點」具有「人」的特性,進而得出,這張是人。

這種特徵點是計算機隨機自動「提取」的,從開發人員的角度看,計算機為什麼提取這些「點」,有時候開發人員也不知道或者說也迷茫,一旦識別出錯,就算是開發人員也很難跟蹤到底是**錯了。套用一句:文學源於生活而又高於生活。計算識別源於程式而又高於程式,在很多科幻片裡,機械人**人人類,而最終又統治了人類。

4.大資料

採用特徵點識別物品時,需要你有大量資料作為特徵點。例如你要搜尋「范冰冰」的**,首先必須有足夠多的范冰冰的**,然後告訴「機器」這是范冰冰。

機器從每張**裡提取「范冰冰」特徵點,最終所有特徵點組成的集合被稱為特徵點集。有了這個特徵集,那麼你上傳「一張**」時,計算機就知道這張**是誰了。

5.機器學習

在上面,你可以看到大資料非常重要,以識別范冰冰為例,你資料庫裡范冰冰取樣**越多,計算機就識別率越高。如果你取樣足夠過,那麼就能更好的實現「機器學習」。

仍以范冰冰為例,機器學習就是讓機器根據現有的范冰冰的**來判斷其它**是不是范冰冰,如果是則自動提取新特徵點,如果不是則忽略(當然機器也可能會有識別失誤)。這種機器學習猶如利息的「利滾利」,會產生馬太效應。

6.人工訓練

在機器獲取特徵點後,必須告訴這個「」是什麼,很多搜尋引擎會根據上下文來判斷。什麼意思呢?例如你開啟乙個網頁,「范冰冰國際影響力這麼強?...」該頁面配有,計算機是不知道這張是什麼,但是計算機能識別文字,他看到標題是「范冰冰」而裡面又有配圖,自然就認為這張**就是「范冰冰」。

谷歌身份驗證

通過這個步驟,谷歌就可以比對「人工判斷」和「機器判斷」是否一致,這種判斷為谷歌提供「自動駕駛」提供更多資料

人臉識別的流程

記錄一下目前對人臉識別流程及識別方法的理解,以後隨著認識的提公升不斷更新 在整個過程中所使用的都是灰度化之後的。為什麼要轉化為灰度?1.識別物體最關鍵的部分是,找到物體的邊緣,就是的梯度,的梯度計算用到的就是灰度化之後的。2.顏色容易受到光照影響,難以提供關鍵資訊,最重要的是灰度化之後可以加快計算速...

人臉識別 文字識別背後的方法,模式識別是什麼?

人臉識別 文字識別背後的方法,模式識別是什麼?模式識別是什麼?作為人工智慧的乙個重要方向,模式識別的主要任務是模擬人的感知能力,如通過視覺和聽覺資訊去識別理解環境,又被稱為 機器感知 或 智慧型感知 人們在觀察事物或現象的時候,常常要尋找它與其他事物或現象的不同之處,並根據一定目的把相似 但又細節不...

人臉識別的深度學習

深度學習只不過是機器學習的標準範例,更準確地說 是其演算法之一。在最大程度上,它基於人腦的概念和神經元的相互作用。如果你開始谷歌搜尋深度學習是什麼,你會發現今天這個超級熱門詞遠遠不是新的。為什麼這樣?該術語本身出現在20世紀80年代,但到2012年,沒有足夠的力量來實施這項技術,幾乎沒有人關注它。在...