深度學習 目標檢測中 IOU 的概念及計算

2021-09-24 06:37:35 字數 2673 閱讀 6297

在目標檢測當中,有乙個重要的概念就是 iou。一般指代模型**的 bbox 和 groud truth 之間的交並比。

何為交並比呢?

集合 a 和集合 b 的並集包括了上面 3 種顏色區域。

集合 c 是集合 a 與集合 b 的交集。

在目標檢測當中,iou 就是上面兩種集合的比值。

a ∪b

a \cup b

a∪b 其實就是 a+b

−ca + b - c

a+b−c。

那麼公式可以轉變為:

i ou

=a∩b

a+b−

(a∩b

)iou = \frac

iou=a+

b−(a

∩b)a

∩b​

iou 衡量兩個集合的重疊程度。

在 2d 目標檢測當中,因為 bbox 是矩形,所以很容易求得 iou。

方框 a 和 b 相交,典型的情況如下:

a 和 b 的面積容易求得,c 的面積稍微繁瑣一點,但耐心細緻的話可以求得。

如果利用數學思維,細心整理,可以發現面積 c 只需要求得邊長的乘積就好,即使 a 和 b 的位置是相對的,但稍加變換也能夠求出。

如果以 w 代表 a 和 b 的交集 c 的 x 軸方向上的邊長,那麼有

w =m

in(a

.x1,

b.x1

)−ma

x(a.

x0,b

.x0)

w = min(a.x_,b.x_) - max(a.x_,b.x_)

w=min(

a.x1

​,b.

x1​)

−max

(a.x

0​,b

.x0​

)同理,

h =m

in(a

.y1,

b.y1

)−ma

x(a.

y0,b

.y0)

h = min(a.y_,b.y_) - max(a.y_,b.y_)

h=min(

a.y1

​,b.

y1​)

−max

(a.y

0​,b

.y0​

)大家仔細觀察上面的對應關係,可以發現公式是成立的。這個公式的推導並不難,無非是 4 個頂點的座標的相對位置變換,大家可以自行琢磨。

如果 a 與 b 根本就不相交。

這個時候可以發現 w <= 0 或 h <= 0.

下面是 python **。

class

bbox

:def

__init__

(self,x,y,w,h)

: self.x = x

self.y = y

self.w = w

self.h = h

defiou

(a,b)

:assert

isinstance

(a,bbox)

assert

isinstance

(b,bbox)

area_a = a.w * a.h

area_b = b.w * b.h

w =min(b.x+b.w,a.x+a.w)

-max

(a.x,b.x)

h =min(b.y+b.h,a.y+a.h)

-max

(a.y,b.y)

if w <=

0or h <=0:

return

0 area_c = w * h

return area_c /

(area_a + area_b - area_c)

if __name__ ==

'__main__'

: a = bbox(1,

1,4,

5)b1 = bbox(1,

1,4,

5)b2 = bbox(5,

1,4,

5)b3 = bbox(3,

2,3,

6)print

("iou "

,iou(a,b1)

)print

("iou "

,iou(a,b2)

)print

("iou "

,iou(a,b3)

)

執行結果如下:

iou  1.0

iou 0

iou 0.26666666666666666

目標檢測中IoU計算

1.含義 iou即交並比 intersection over union 是真實的目標框ground truth與演算法 出來的目標框prediction之間差距的衡量指標。計算公式 iou a b a b 一般來說,iou值越大,說明 的越準確,通常取0.5作為閾值。2.python程式實現 de...

1 目標檢測中IOU評價函式

在目標檢測的評價體系中,有乙個引數叫做 iou 簡單來講就是模型產生的目標視窗和原來標記視窗的交疊率。具體我們可以簡單的理解為 即檢測結果 detectionresult 與 ground truth 的交集比上它們的並集,即為檢測的準確率 iou 如下圖所示 gt groundtruth dr d...

深度學習目標檢測

流程狂徒如下 1 使用selective search提取proposes,然後利用cnn等識別技術進行分類。2 使用識別庫進行預訓練,而後用檢測庫調優引數。3 使用svm代替了cnn網路中最後的softmax,同時用cnn輸出的4096維向量進行bounding box回歸。4 流程前兩個步驟 候...