因為去修改deploy.prototxt中nums_threshold引數,想到研究一下nms非極大抑制,記錄一下簡單的理解。
非極大抑制用在目標檢測後篩選最終結果,更精確的定位。
一般分三步:
1、置信度排序並選出框置信度最高的框
2、計算其他框與最高置信度框的iou,若iou大於閾值(nums_threshold),則認為與最大一致,去除,保留最大。
3、從未處理的框中重新選置信度最高的框,繼續1、2
python**:
import numpy as np
dets = np.array([
[204, 102, 358, 250, 0.5],
[257, 118, 380, 250, 0.7],
[280, 135, 400, 250, 0.6],
[255, 118, 360, 235, 0.7]])
thresh = 0.3
def nms(dets, thresh):
x1 = dets[:, 0]
y1 = dets[:, 1]
x2 = dets[:, 2]
y2 = dets[:, 3]
scores = dets[:, 4]
areas = (x2 - x1 + 1) * (y2 - y1 + 1) # 每個boundingbox的面積
order = scores.argsort()[::-1] # boundingbox的置信度排序
keep = # 用來儲存最後留下來的boundingbox
while order.size > 0:
i = order[0] # 置信度最高的boundingbox的index
# 當前bbox和剩下bbox之間的交叉區域
# 選擇大於x1,y1和小於x2,y2的區域
xx1 = np.maximum(x1[i], x1[order[1:]])
yy1 = np.maximum(y1[i], y1[order[1:]])
xx2 = np.minimum(x2[i], x2[order[1:]])
yy2 = np.minimum(y2[i], y2[order[1:]])
# 當前bbox和其他剩下bbox之間交叉區域的面積
w = np.maximum(0.0, xx2 - xx1 + 1)
h = np.maximum(0.0, yy2 - yy1 + 1)
inter = w * h
# 交叉區域面積 / (bbox + 某區域面積 - 交叉區域面積)
ovr = inter / (areas[i] + areas[order[1:]] - inter)
#保留交集小於一定閾值的boundingbox
inds = np.where(ovr <= thresh)[0]
order = order[inds + 1]
return keep
print nms(dets, thresh)
非極大值抑制(NMS)
非極大值抑制 nms 非極大值抑制顧名思義就是抑制不是極大值的元素,搜尋區域性的極大值。這個區域性代表的是乙個鄰域,鄰域有兩個引數可變,一是鄰域的維數,二是鄰域的大小。這裡不討論通用的nms演算法,而是用於在目標檢測中用於提取分數最高的視窗的。例如在行人檢測中,滑動視窗經提取特徵,經分類器分類識別後...
NMS非極大值抑制
非極大值抑制演算法 non maximum suppression for object detection in python 非極大值抑制演算法 nms 非極大值抑制 矩形框融合 nms 卷積網路改進實現 筆記 人臉檢測視窗選擇辦法 nms convnet 開源 如何用soft nms實現目標檢...
非極大值抑制(NMS)
非極大值抑制 nms 非極大值抑制顧名思義就是抑制不是極大值的元素,搜尋區域性的極大值。這個區域性代表的是乙個鄰域,鄰域有兩個引數可變,一是鄰域的維數,二是鄰域的大小。這裡不討論通用的nms演算法,而是用於在目標檢測中用於提取分數最高的視窗的。例如在行人檢測中,滑動視窗經提取特徵,經分類器分類識別後...