視覺顯著性檢測(visual saliency detection)指通過智慧型演算法模擬人的視覺特點,提取影象中的顯著區域(即人類感興趣的區域)。
視覺注意機制(visual attention mechanism,va),即面對乙個場景時,人類自動地對感興趣區域進行處理而選擇性地忽略不感興趣區域,這些人們感興趣區域被稱之為顯著性區域。如圖所示,當看到這幅影象時,圖中的四個人最能引起人的注意。
人類視覺注意機制有兩種策略:
利用影象的顏色、亮度、對比度、邊緣等特徵表示,判斷目標區域和它周圍畫素的差異,進而計算影象區域的顯著性。
對比度itti
把方向,顏色,亮度等特徵進行了融合,通過融合特徵的對比度得到了一張灰度圖,灰度圖中的灰度值代表畫素點屬於顯著區域的概率。
無論是基於區域性對比度還是基於全域性對比度,基於對比度的方法仍然有缺陷,如顯著區域內部會發生衰減
對比度累加演算法(accumulate contrast, ac)
邊緣先驗
研究影象中的背景應該具有怎樣的性質。如果能清楚的知道背景的性質,就可以得到影象中的背景,近而找到前景。
變換域有效編碼假設,該假設可以有效的消除了輸入中的冗餘。有效編碼假設認為,影象可以被分解為兩個部分,乙個部分是新穎的,另乙個部分是已知的。
受到有效編碼假設的啟發,認為影象顯著區域檢測問題中可以把顯著區域視為新穎的部分,背景部分可以視為已知的部分。求出影象對數譜和幅度譜並除去幅度譜的冗餘分量,利用原影象和冗餘譜得到影象顯著區域的殘差譜。
剩餘譜(spectral residual, sr)演算法和頻域變換演算法
多先驗融合
研究者們希望把盡可能多的顯著區域檢測的先驗加入到顯著性檢測演算法中,認為顯著區域檢測方法分為基於全域性的方法和基於區域性的方法。但是這兩種方法都存在缺陷。人類視覺系統皮層在觀察物體時是先中心後周圍的。同時人類對於區域性的,對比度比較高的區域比較敏感。提出了一種結合全域性與區域性特徵的顯著區域檢測方法[
由人的「認知因素」 決定, 從高層視覺資訊入手,比如知識、預期和當前的目標.對影象的特定特徵來計算影象區域的顯著性。監控任務下, 場景中的人體能引起注意。
近年來研究者們在特徵綜合理論和guided search等注意的心理學模型基礎上, 提出了大量的可計算的注意力選擇模型,以用於模擬人類的視覺注意機制。這些模型包括: 基於認知、貝葉斯、決策論、資訊理論、圖模型、頻域分析、基於模式分類、基於cnn的等人視覺注意模型。
認知模型
幾乎所有模型都直接或間接地受認知模型啟發而來,其一大特點是與心理學和神經學相結合。itti模型(使用三個特徵通道:顏色、屬性、方向)是這一類模型的代表,也是後來很多衍生模型的基礎
資訊理論模型
本質是最大化來自所處視覺環境的資訊,其中最有影響力的模型是aim模型。
圖論模型
圖模型是乙個使用圖對隨機變數之間的條件依賴結構進行表示的概率框架。這種型別的注意模型,把眼動看作乙個時間序列。由於有大量的隱變數影響眼球運動的產生,因此,該類注意模型使用了隱馬爾科夫模型、動態貝葉斯網和條件隨機場等方法。圖模型可以對複雜的注意機制建模,因此能取得較好的**能力,缺點在於模型的高複雜度,尤其涉及訓練和可讀性時。
典型模型有:基於圖論的視覺顯著性(graph-based visual saliency , gbvs)模型等
在g 上定義乙個馬爾科夫鏈,當乙個節點與其鄰域節點特徵差異性較大時,那麼將在這個節點上停留更長時間,基於停留時間可以計算出a中每個節點的響應值。
頻域模型
基於頻譜分析的顯著性模型,形式簡潔,易於解釋和實現,並且在注意焦點**和顯著區域檢測方面取得了很大的成功,但其生物合理性不是非常清楚。經典模型有:頻譜殘差的顯著性檢測模型(純數學計算方法)。
超分割是指根據一定的規則把影象分成若干個小塊。後續的演算法通常會對超畫素而不是畫素點進行操作。
(1) 精確召回(pr)。首先將顯著圖s轉化為二進位制掩碼m,然後通過將m與地面真值g進行比較來計算precission和recall:
(2) f值:通常precission和recall都不能完全評估顯著圖的質量,為此提出f值作為precission和recall的非負權重的集權跳河平均:
(3) roc(receiver operating characteristic)曲線:是以假正率(fp_rate)和假負率(tp_rate)為軸的曲線
(4)roc曲線下面積(auc):auc越大效能越好
(5) 平均絕對誤差(mae):進行更全面的比較。
視覺顯著性
視覺顯著性 visual saliency detection 是指對於真實世界中的場景,人們會自動的識別出感興趣區域 region of interesting 並對感興趣的區域進行處理忽略掉不感興趣的區域。比較典型的視覺顯著性的標註為下圖所示 人體視覺顯著性 人類的視覺注意機制有兩個策略 自底向...
關於顯著性檢測的思考
梳理visual saliency 的定義,視覺顯著性是乙個主觀目標,既有自上而下的任務驅動的注意機制,全域性的拓撲認知,也有自下而上的基於區域性特徵的多層次融合機制。因此顯著性也是乙個從主觀上定義,客觀上驗證該定義的視覺過程。因此顯著性的定義上從主觀上是任務驅動的視覺搜尋過程,這個過程 的是注意機...
顯著性檢測評價指標
m為二值化的顯著 圖,g為ground truth.通過設定閾值得到二值化的顯著 圖m,通過上式計算得到一對precision,recall 所有的p,r取平均 閾值取值為0 255.這樣,不同的閾值,對應不同的p r對,總共有256個p r對。以p為縱座標,r為橫座標,構成p r曲線。參考 2一般...