語義分割 語義分割任務中最常用的評價指標

2021-10-06 06:35:42 字數 1278 閱讀 8976

語義分割目前在自動駕駛場景解析、醫學影象分割等多個領域被廣泛應用,簡言之,是對每個畫素進行分類。

目前語義分割中最常用的評價指標是平均交並比 (mean inetersection over union, 簡稱miou)(這個最常用) 和 畫素準確率 (pixel accuracy, 簡稱pa),在主流的期刊、會議**中被作為方法驗證的主要評價指標。在介紹這兩個評價指標之前,先簡單介紹一下混淆矩陣,因為這兩種指標都是建立在混淆矩陣的基礎上得到的。

對於以下指標,我們假設共有k+1類,(從l

0l_0

l0​到l

kl_k

lk​,包括乙個空類或者是背景),pij

p_pi

j​是本屬於第i

ii類卻被分到第j

jj類的畫素數量,pii

p_pi

i​代表的是分類正確的正例數量,其他幾個p

pp值類似。

畫素準確率的計算公式為:

計算的是正確分類的畫素數量與所有畫素數量的比值,

用混淆矩陣表示即:

$pa = (tp + tn)/(tp + fp + tn + fn) $

畫素準確率平均值(mpa):表示正確分類畫素的比例是按類計算的,最終由類總數取平均。

這是用於分割問題的標準評價指標,其計算的是兩個集合的交集與其並集的重合比例,在本問題中,其計算的便是真實分割與系統**的分割之間的交並比。這個比例可以被重新定義為真實正例(交集)的數量除以總數量(包括真實正例、錯誤負例、以及錯誤正例(並集))。iou也是按類計算最後取平均。

利用混淆矩陣表示:

m io

u=(t

p)/(

tp+f

p+fn

)miou = (tp)/(tp+fp+fn)

miou=(

tp)/

(tp+

fp+f

n)頻率加權交並比(fwiou):是對miou的改進,對每個類別按照重要性進行加權,重要性來自於其出現的頻率。

語義分割綜述

目前語義分割的流行框架可以分為前端 後端。前端採用fcn定位不同類別的物體,後端採用rf crf mrf 精確定位物體邊界。也就是說,前端解決 是什麼 what 後端解決 在 where 可以把語義分割網路分為兩類 以fcn為代表的編解碼器 encode decode 網路 以deeplab為代表的...

語義分割概述

影象語義分割 一 影象語義分割含義及原理 含義 對分割後的影象加上語義標籤 用不同的顏色代表不同類別的物體 就是給分割後影象中的每一類物體加上標籤,輸入一般是彩色深度 rgb d 影象。要求 1 分割得到的不同區域內部平整,其紋理和灰度有相似性 2 相鄰語義分割區域對分割所依據的性質有明顯的差異 3...

語義分割概述

本文大多來自方便讀 使用 影象語義分割 semantic segmentation 從字面意思上理解就是讓計算機根據影象的語義來進行分割,例如讓計算機在輸入下面左圖的情況下,能夠輸出右圖。語義在語音識別中指的是語音的意思,在影象領域,語義指的是影象的內容,對意思的理解,並對不同部分進行標註,圖中紅色...