每個haar特徵對應看乙個弱分類器,但並不是任伺乙個haar特徵都能較好的描述人臉灰度分布的某一特點,如何從大量的haar特徵中挑選出最優的haar特徵並製作成分類器用於人臉檢測,這是adaboost演算法訓練過程所要解決的關鍵問題。
paul viola和michael jones於2023年將adaboost演算法應用於人臉檢測中,其基本思想是針對不同的訓練集訓練同乙個分類器(弱分類器),然後把這些不同訓練集上的得到的分類器聯合起來,構成乙個最終的強分類器。adaboost 演算法中不同的訓練集是通過調整每個樣本對應的權重來實現的。開始時,每個樣本對應的權重是相同的,對於h1分類錯誤的樣本,加大其對應的權重; 而對於分類正確的樣本, 降低其權重, 這樣分錯的樣本就被突出出來,從而得到乙個新的樣本分佈 u2。在新的樣本分佈下,再次對弱分類器進行訓練,得到弱分類器 h2 。依次類推,經過 t 次迴圈,得到 t 個弱分類器,把這 t個弱分類器按一定的權重疊加(boost)起來,得到最終想要的強分類器。
訓練系統總體框架,由「訓練部分」和 「 補充部分」構成。依據系統框架,本文的訓練系統可分為以下幾個模組:
(1)以樣本集為輸入,在給定的矩形特徵原型下,計算並獲得矩形特徵集;
(2)以特徵集為輸入,根據給定的弱學習演算法,確定閩值,將特徵與弱分類器一一對應,獲得弱分類器集;
(3)以弱分類器集為輸入, 在訓練檢出率和誤判率限制下, 使用a d a b o o s t 演算法
挑選最優的弱分類器構成強分類器;
(4)以強分類器集為輸入,將其組合為級聯分類器;
(5)以非人臉集為輸入,組合強分類器為臨時的級聯分類器,篩選並補充
非人臉樣本。
訓練樣本的選擇:
訓練樣本要求是面部特寫影象,圖1是一簇訓練樣本,大小被歸一化為24×24畫素,其中正訓練樣本要求是面部特寫影象,但是人臉形態千差萬別,所以訓練樣本選取過程中要考慮到樣本的多樣性。負訓練樣本,大小被歸一化為24×24畫素,其中各樣本不完全相同,分別具有一定的代表性。
圖1部分訓練正樣本集和訓練負樣本集
訓練過程分為3個步驟:首先需要提取haar特徵;然後將haar特徵轉化成對應的弱分類器;最後從大量的弱分類器中迭代選擇出最優弱分類器。
(1)提取haar特徵
圖2 常用的四種haar特徵
常用的haar特徵有4種,如圖2所示。當然也可以在這4種特徵的基礎上設計出更多、更複雜的特徵。以大小為24x24畫素的訓練樣本為例,上述4種特徵的總個數超過了160000個。這樣龐大的數字給後續的迭代訓練工作帶來了龐大的計算量,直接導致adaboost演算法訓練過程極為費時,這恰恰是演算法需要改進的關鍵問題之一o
(2)生成弱分類器
每乙個haar特徵都對應著乙個弱分類器,每乙個弱分類器都是根據它所對應的haar特徵的引數來定義的。利用上述haar特徵的位置資訊,對訓練樣本進行統計就可以得到對應的特徵引數。adaboost演算法中所訓練的弱分類器是任何分類器,包括決策樹,神經網路,隱馬爾科夫模型,如果弱分類器是線性神經網路,那麼adaboost演算法每次將構造多層感知器的乙個節點。
(3)採用adaboost演算法選取優化的弱分類器
adaboost演算法訓練過程就是挑選最優弱分類器,並賦予權重過程,圖3是adaboost演算法訓練示意圖。
圖3 adaboost演算法訓練示意圖
AdaBoost演算法原理
演算法原理 adaboost 演算法針對不同的訓練集訓練同乙個基本分類器 弱分類器 然後把這些在不同訓練集上得到的分類器集合起來,構成乙個更強的最終的分類器 強分類器 理論證明,只要每個弱分類器分類能力比隨機猜測要好,當其個數趨向於無窮個數時,強分類器的錯誤率將趨向於零。adaboost 演算法中不...
整合演算法原理 Adaboost
有位前輩總結得很清晰有條理,借鑑一下 簡單把裡面我自己要備忘的要點概括一下 1 基本原理 boosting演算法的工作機制是首先從訓練集用初始權重訓練出乙個弱學習器1,根據弱學習的學習誤差率表現來更新訓練樣本的權重,使得之前弱學習器1學習誤差率高的訓練樣本點的權重變高,使得這些誤差率高的點在後面的弱...
AdaBoost原理詳解
寫一點自己理解的adaboost,然後再貼上面試過程中被問到的相關問題。按照以下目錄展開。當然,也可以去我的部落格上看 面經adaboost是典型的boosting演算法,屬於boosting家族的一員。在說adaboost之前,先說說boosting提公升演算法。boosting演算法是將 弱學習...