NMS 非極大值抑制

2021-08-07 01:32:02 字數 2233 閱讀 6141

nms(non maximum suppression),中文名非極大值抑制,在很多計算機視覺任務中都有廣泛應用,如:邊緣檢測、目標檢測等。

這裡主要以人臉檢測中的應用為例,來說明nms,並給出matlab和c++示例程式。

人臉檢測的一些概念

(1) 絕大部分人臉檢測器的核心是分類器,即給定乙個尺寸固定,分類器判斷是或者不是人臉;

(2)將分類器進化為檢測器的關鍵是:在原始影象上從多個尺度產生視窗,並resize到固定尺寸,然後送給分類器做判斷。最常用的方法是滑動視窗。

以下圖為例,由於滑動視窗,同乙個人可能有好幾個框(每乙個框都帶有乙個分類器得分)

而我們的目標是乙個人只保留乙個最優的框:

於是我們就要用到非極大值抑制,來抑制那些冗餘的框: 抑制的過程是乙個迭代-遍歷-消除的過程。

(1)將所有框的得分降序排列,選中最高分及其對應的框:

(2)遍歷其餘的框,如果和當前最高分框的重疊面積(iou)大於一定閾值,我們就將框刪除。

(3)從未處理的框中繼續選乙個得分最高的,重複上述過程。

下面給出matlab下的快速nms**,並帶有詳細的注釋:

%% nms:non maximum suppression

function

pick = nms

(boxes,threshold,type)

% boxes: m x 5,表示有m個框,5列分別是[x1 y1 x2 y2 score]

% threshold: iou閾值

% type:iou閾值的定義型別

% 輸入為空,則直接返回

ifisempty(boxes)

pick = ;

return;

end% 依次取出左上角和右下角座標以及分類器得分(置信度)

x1 = boxes(:,1);

y1 = boxes(:,2);

x2 = boxes(:,3);

y2 = boxes(:,4);

s = boxes(:,5);

% 計算每乙個框的面積

area = (x2-x1+1) .* (y2-y1+1);

%將得分公升序排列

[vals, i] = sort(s);

%初始化

pick = s*0;

counter = 1;

% 迴圈直至所有框處理完成

while ~isempty(i)

last = length(i); %當前剩餘框的數量

i = i(last);%選中最後乙個,即得分最高的框

pick(counter) = i;

counter = counter + 1;

%計算相交面積

xx1 = max(x1(i), x1(i(1:last-1)));

yy1 = max(y1(i), y1(i(1:last-1)));

xx2 = min(x2(i), x2(i(1:last-1)));

yy2 = min(y2(i), y2(i(1:last-1)));

w = max(0.0, xx2-xx1+1);

h = max(0.0, yy2-yy1+1);

inter = w.*h;

%不同定義下的iou

if strcmp(type,'min')

%重疊面積與最小框面積的比值

o = inter ./ min(area(i),area(i(1:last-1)));

else

%交集/並集

o = inter ./ (area(i) + area(i(1:last-1)) - inter);

end%保留所有重疊面積小於閾值的框,留作下次處理

i = i(find(o<=threshold));

endpick = pick(1:(counter-1));

end

非極大值抑制(NMS)

非極大值抑制 nms 非極大值抑制顧名思義就是抑制不是極大值的元素,搜尋區域性的極大值。這個區域性代表的是乙個鄰域,鄰域有兩個引數可變,一是鄰域的維數,二是鄰域的大小。這裡不討論通用的nms演算法,而是用於在目標檢測中用於提取分數最高的視窗的。例如在行人檢測中,滑動視窗經提取特徵,經分類器分類識別後...

NMS非極大值抑制

非極大值抑制演算法 non maximum suppression for object detection in python 非極大值抑制演算法 nms 非極大值抑制 矩形框融合 nms 卷積網路改進實現 筆記 人臉檢測視窗選擇辦法 nms convnet 開源 如何用soft nms實現目標檢...

非極大值抑制(NMS)

非極大值抑制 nms 非極大值抑制顧名思義就是抑制不是極大值的元素,搜尋區域性的極大值。這個區域性代表的是乙個鄰域,鄰域有兩個引數可變,一是鄰域的維數,二是鄰域的大小。這裡不討論通用的nms演算法,而是用於在目標檢測中用於提取分數最高的視窗的。例如在行人檢測中,滑動視窗經提取特徵,經分類器分類識別後...