顯著檢測——graph-based visual saliency
harel等人2023年在nips上發表了一篇基於圖的顯著檢測的文章,這篇文章基於itti方法的基本框架和原理,同時又用馬爾科夫隨機場的模型來模擬人在觀察影象時複雜的視覺轉移過程,取得了很好的效果。文章的出發點很新穎,而且和生物的視覺注意方式有著很強的相似性,在現有方法中是一種有代表性的方法。
文章將顯著檢測的一般過程劃分為三個階段:
1.特徵提取階段。在影象平面的各個位置上提取出對顯著檢測有貢獻的特徵向量。
2.顯著圖啟用階段。利用特徵向量經過特定的演算法形成啟用後的顯著圖。
3.歸一化和融合。將啟用圖歸一化並將所有歸一化後的啟用圖融合成為最終的顯著圖。
這三個階段和itti最開始的那篇文章所提出的框架是一致的,即尋找合適的特徵、用檢測方法形成各個顯著圖和將所有顯著圖融合為最終的顯著圖。
gbvs的第乙個階段沿用itti所提出的方法形成特徵圖,第二個階段的具體內容如下:
對於每一幅特徵圖,各個位置之間的狀態轉移矩陣與它們的空間位置和特徵的不相似程度有關。兩個位置的特徵越不相似則它們之間轉移的可能就越大,因為視覺總會往和目前位置不同的位置轉移以期獲得更加豐富的資訊。兩個位置之間的空間距離越小,則它們相互的轉移可能就越大,因為視覺的轉移或跳變更易於到目前位置的周圍。基於此而構造的轉移權值為
其中d是兩個位置的特徵距離,f為兩個位置的空間距離,具體表示式如下
將各個位置的初始狀態設為隨機,結合以上的狀態轉移矩陣,經過一定次數的迭代之後便可以達到收斂,形成各位置的終態。這個最終的狀態便是所得的顯著子圖。
第三個階段的融合過程和第二個階段類似,初始狀態為第二階段的終態,狀態轉移矩陣考慮了顯著位置所具有的區域性聚集性,設計了各個位置的連線權值,如下所示
a為到達位置的初始狀態,即它的顯著程度,f是兩個位置的空間距離。這樣做是為了將顯著mass聚集到顯著值大的地方,從而避免了分散的結果。同樣經過若干次迭代之後演算法會收斂到乙個穩態,這個穩態便是第三部的顯著圖。最後經過平滑之後就得到了最終的顯著圖結果。
實驗結果:
在msra資料庫上用gbvs方法對1000幅影象進行了測試,以下是得到的兩幅顯著圖示例。
可以看出gbvs具有很好的檢測效能,而且在不同環境下都有很準確的定位能力,不依賴於影象的邊緣資訊。在計算上比其它方法更為耗時,這是由於馬爾科夫模型的迭代過程需要花費一定的時間。
顯著檢測學習總結3
顯著檢測 context aware 基於上下文的顯著檢測是goferman於2010年提出的一種新的顯著檢測概念,它和之前的itti的顯著性的定義有一定區 別。他認為在諸如影象分類的任務中我們不但要關注顯著的物體而且也要關注到部分的能夠傳遞文字資訊的背景。人眼在關注顯著區域的同時也會順帶關注其周圍...
顯著性檢測學習筆記(一)
基於均值漂移分割的顏色顯著性模型xu liu,zengchang qin1,xiaofan zhang,and tao wan,2013 ieee 基本的流程圖如下 1 基於qdct係數求rk的品均顯著值公式為 rk 表示區域的總共的畫素值,得到大致顯著圖m,通過大致顯著圖得到前景p f 和背景p ...
關於顯著性檢測的思考
梳理visual saliency 的定義,視覺顯著性是乙個主觀目標,既有自上而下的任務驅動的注意機制,全域性的拓撲認知,也有自下而上的基於區域性特徵的多層次融合機制。因此顯著性也是乙個從主觀上定義,客觀上驗證該定義的視覺過程。因此顯著性的定義上從主觀上是任務驅動的視覺搜尋過程,這個過程 的是注意機...