dpm演算法採用了改進後的hog特徵,svm分類器和滑動視窗(sliding windows)檢測思想,針對目標的多視角問題,採用了多元件(component)的策略,針對目標本身的形變問題,採用了基於圖結構(pictorial structure)的部件模型策略。此外,將樣本的所屬的模型類別,部件模型的位置等作為潛變數(latent variable),採用多示例學習(multiple-instance learning)來自動確定。
平均精度均值(map)是**目標位置以及類別的這一類演算法的效能度量標準。map 對於評估目標定位模型、目標檢測模型以及例項分割模型非常有用。
在模型**時,輸出的 bounding box 是有很多的,但是大部分都是置信度很小的,我們只需要輸出置信度超過某個閾值的 bounding box 。
tp —— true positive (真正, tp)是指某(些)個正樣本被**判定為正;此種情況可以稱作判斷為真的正確情況【correctly identified】。
tn —— true negative(真負 , tn)是指某(些)個負樣本被**判定為負;此種情況可以稱作判斷為假的正確情況【correctly rejected】。
fp ——false positive (假正, fp)是指某(些)個負樣本被模型**為正;此種情況可以稱作判斷為真的錯誤情況,或稱為誤報【incorrectly identified】。
fn——false negative(假負 , fn)是指某(些)個正樣本被模型**為負;此種情況可以稱作判斷為假的錯誤情況,或稱為漏報【incorrectly rejected】。
準確率和召回率是互相影響的,因為如果想要提高準確率就會把**的置信率閾值調高,所有置信率較高的**才會被顯示出來,而那一些正確正**(true positive)可能因為置信率比較低而沒有被顯示了。一般情況下準確率高、召回率就低,召回率低、準確率高,如果兩者都低,就是網路出問題了。
一般來說影響 map 的原因有很多,主要有以下幾個:
1. 不好的訓練資料。
2. 訓練資料不夠多。
3. 標註的框不準確。
4. 資料的多變性。
有的時候增加訓練資料可能 map 並不會增加多少。當然了,使用表現更好的網路,其 map 自然地也會更加的高。
iou 的全稱為交並比(intersection over union)。iou 計算的是 「**的邊框」 和 「真實的邊框」 的交集和並集的比值。
dropout layer的目的是為了防止cnn 過擬合, 在訓練過程中,將神經網路進行取樣,也就是隨機的讓神經元啟用值為0,而在測試時不再採用dropout。通常設定隨機取樣概率為0.5,也可以通過驗證集來確定取樣概率。
1.**前向傳播**
訓練階段:前向傳播給定每個神經元乙個隨機值(0~1),假定設定取樣閾值為0.5,如果該神經元對應的隨機值小於0.5,則設定該神經元為0,否則設定該神經元值為2乘以原值,(1/0.5),並把所有神經元對應的隨機值儲存下來,在後向傳播是需要使用。
測試階段:無需dropout。
2.**反向傳播**
讀取在前向傳播記錄的隨機值,同樣的操作:該梯度值對應的隨機值小於0.5,則設定該梯度值為0,否則設定該梯度值為2乘以原值,(1/0.5)。
非極大值抑制,簡稱為nms演算法,英文為non-maximum suppression。其思想是搜素區域性最大值,抑制極大值。
目標檢測的過程中在同一目標的位置上會產生大量的候選框,這些候選框相互之間可能會有重疊,此時我們需要利用非極大值抑制找到最佳的目標邊界框,消除冗餘的邊界框。
左圖是人臉檢測的候選框結果,每個邊界框有乙個置信度得分(confidence score),如果不使用非極大值抑制,就會有多個候選框出現。右圖是使用非極大值抑制之後的結果,符合我們人臉檢測的預期結果。
前提:目標邊界框列表及其對應的置信度得分列表,設定閾值,閾值用來刪除重疊較大的邊界框。iou:intersection-over-union,即兩個邊界框的交集部分除以它們的並集。
非極大值抑制的流程如下:
· 根據置信度得分進行排序
· 選擇置信度最高的邊界框新增到最終輸出列表中,將其從邊界框列表中刪除
· 計算所有邊界框的面積
· 計算置信度最高的邊界框與其它候選框的iou
· 刪除iou大於閾值的邊界框
· 重複上述過程,直至邊界框列表為空。
假設在乙個單類別檢測問題中的樣本有兩類(背景算1類)。background false positive就是把background錯誤檢測為正樣本框 的數量。
roi(region of interest),感興趣區域。機器視覺、影象處理中,從被處理的影象以方框、圓、橢圓、不規則多邊形等方式勾勒出需要處理的區域,稱為感興趣區域,roi。
在影象處理領域,感興趣區域(roi) 是從影象中選擇的乙個影象區域,這個區域是你的影象分析所關注的重點。圈定該區域以便進行進一步處理。使用roi圈定你想讀的目標,可以減少處理時間,增加精度。
目標檢測入門 目標檢測基本概念
目標檢測關注影象中特定的物體目標,要求同時獲得這一目標的類別資訊和位置資訊。檢測給出的是對前景和背景的理解,需要從背景中分離出感興趣的目標,並確定這一目標的描述 類別和位置,常用檢測框表示 與影象分類的區別,目標檢測更具難度 影象分類只需要判斷輸入的影象中是否包含感興趣物體,而不需要定位具體位置 如...
目標檢測 mAP的概念
5 什麼是ap 6 什麼是map 在github上我們可以看到許多模型,他們都有map值的評價指標 這到底是個啥呢?要了解它必須要先了解以下幾個概念 tp true positives 意思就是被分為了正樣本,而且分對了。tn true negatives 意思就是被分為了負樣本,而且分對了,fp ...
關於目標檢測中的AP,mAP解釋
1.ap 現在目標檢測 中coco資料集上的衡量標準 目標檢測演算法的常用評價標準,實際上是mmap,因為是多個iou閾值的平均map,含義為iou閾值 檢測框與groundtruth的iou大於該閾值時認為是正樣本 從0.5到0.95逐步遞增0.05時共10個iou閾值下的map的平均值。而在pa...