語義分割目前在自動駕駛場景解析、醫學影象分割等多個領域被廣泛應用,簡言之,是對每個畫素進行分類。
目前語義分割中最常用的評價指標是平均交並比 (mean inetersection over union, 簡稱miou)(這個最常用) 和 畫素準確率 (pixel accuracy, 簡稱pa),在主流的期刊、會議**中被作為方法驗證的主要評價指標。在介紹這兩個評價指標之前,先簡單介紹一下混淆矩陣,因為這兩種指標都是建立在混淆矩陣的基礎上得到的。
對於以下指標,我們假設共有k+1類,(從l
0l_0
l0到l
kl_k
lk,包括乙個空類或者是背景),pij
p_pi
j是本屬於第i
ii類卻被分到第j
jj類的畫素數量,pii
p_pi
i代表的是分類正確的正例數量,其他幾個p
pp值類似。
畫素準確率的計算公式為:
計算的是正確分類的畫素數量與所有畫素數量的比值,
用混淆矩陣表示即:
$pa = (tp + tn)/(tp + fp + tn + fn) $
畫素準確率平均值(mpa):表示正確分類畫素的比例是按類計算的,最終由類總數取平均。
這是用於分割問題的標準評價指標,其計算的是兩個集合的交集與其並集的重合比例,在本問題中,其計算的便是真實分割與系統**的分割之間的交並比。這個比例可以被重新定義為真實正例(交集)的數量除以總數量(包括真實正例、錯誤負例、以及錯誤正例(並集))。iou也是按類計算最後取平均。
利用混淆矩陣表示:
m io
u=(t
p)/(
tp+f
p+fn
)miou = (tp)/(tp+fp+fn)
miou=(
tp)/
(tp+
fp+f
n)頻率加權交並比(fwiou):是對miou的改進,對每個類別按照重要性進行加權,重要性來自於其出現的頻率。
語義分割綜述
目前語義分割的流行框架可以分為前端 後端。前端採用fcn定位不同類別的物體,後端採用rf crf mrf 精確定位物體邊界。也就是說,前端解決 是什麼 what 後端解決 在 where 可以把語義分割網路分為兩類 以fcn為代表的編解碼器 encode decode 網路 以deeplab為代表的...
語義分割概述
影象語義分割 一 影象語義分割含義及原理 含義 對分割後的影象加上語義標籤 用不同的顏色代表不同類別的物體 就是給分割後影象中的每一類物體加上標籤,輸入一般是彩色深度 rgb d 影象。要求 1 分割得到的不同區域內部平整,其紋理和灰度有相似性 2 相鄰語義分割區域對分割所依據的性質有明顯的差異 3...
語義分割概述
本文大多來自方便讀 使用 影象語義分割 semantic segmentation 從字面意思上理解就是讓計算機根據影象的語義來進行分割,例如讓計算機在輸入下面左圖的情況下,能夠輸出右圖。語義在語音識別中指的是語音的意思,在影象領域,語義指的是影象的內容,對意思的理解,並對不同部分進行標註,圖中紅色...