尺度空間的理解

2022-09-17 04:06:13 字數 2474 閱讀 8277

不從數學上來推倒什麼是尺度空間,只是從生活常識方面來解釋尺度空間的意義,意義懂了,數學方面自然就好理解了。

好。首先我們提出乙個問題,請看下面的,讓我們我們人為的判斷下所顯示的左右中哪個的角尖銳?接下來我們慢慢的分析,在這其中我們會發現很有意思的事情。

分析:圖1(a)中,顯然右邊的角更尖銳,這是因為同左邊的角相比其角度值較小。

圖1(b)中,也是右邊的角更尖銳,這是因為同左邊的角相比其曲率值較大。

圖1(c)中的第三組角,問題的答案則要困難得多。左邊的角一方面具有較小的角度值(因此更尖銳),另一方面又具有較小的曲率值(因此更圓鈍)。右邊的角情形剛好相反,一方面因為具有較大的角度值更圓鈍,另一方面又因為具有較大的曲率值顯得更尖銳。事實上,本問題對於第一組角和第二組角來說是純粹的數學問題,依據數學上的基本概念(即角度、曲率) 便可以做出判斷。而第三組中兩個角之間的比較已經不再是純粹的數學問題,在數學上沒有明確的答案。有意思吧。確切地說,這是乙個尺度空間中的視覺問題,其答案取決於問題所在的「尺度」而不是某個數學指標。這裡,「尺度」可以被直觀地理解為觀察視窗的大小。

圖1(c)中,我們觀察兩個角的視窗大小都是12*16。在圖1(d)中,調整了觀察視窗,其大小變成120*160(假設所比較的兩個角都具有無限長的邊)。

在這個較大的尺度下,問題的答案變得非常明朗:左邊的角更加尖銳。

在圖1(e)中,觀察視窗的大小變更為6*8。

在這個較小的尺度下,問題的答案發生了有趣的變化:此時右邊的角更加尖銳。

此例子的結果闡述了「尺度」對於解決視覺問題的重要性,即乙個視覺問題的答案往往會依賴於其所在的尺度。在生活中這樣的例子也比比皆是,比如要觀察一棵樹,所選擇的尺度應該是「公尺」級;如果觀察樹上的樹葉,所選擇的尺度則應該是「厘公尺」級。一般來說,攝像裝置所能呈現的畫面解析度是固定的。要以同樣的解析度分別觀察樹和樹葉,我們需要調整攝像裝置的攝像位置。因此,視覺問題中的「尺度」概念也可以被形象地理解為攝像裝置與被觀察物體之間的距離:較遠的距離對應較大的尺度,較近的距離對應較小的尺度。

接下來我們看看第二個例子吧,看看圖二中顯示的那些事角點?

圖2(a)呈現了一片雪花的形狀輪廓,要求我們找出該形狀上的角點。在很多計算機視覺任務中,角點都有著重要的作用。數學上,角點一般是指大曲率點或曲率無窮大點。

在圖2(b)中,雪花形狀上所有曲率無窮大點都被確認為角點,一共有192個,如圓圈所標記。這個答案在數學上無疑是正確的、完美的令人驚奇的,但它對於完成乙個視覺任務(比如理解和分析這個形狀)來說並沒有多大的意義。如果我們僅選擇圖2(c)中所標記出的48個點作為角點,感覺上要更好點。作為圖2(b)中所標記的192個角點中的一部分,這48個角點在理解和分析雪花形狀的結構時要比其餘的角點具有更高的重要性。實際上,按照這一思路,我們不難發現在這48個角點中又有12個角點其重要性還要更高一些,如圖2(d)中所標記。

同例1 一樣,本例中問題的答案依賴於問題所在的尺度。當我們非常靠近雪花形狀觀察它時(即在較小的尺度下),能夠看清楚所有的細節,卻不容易感知其整體輪廓,從而傾向於不加區分地選取圖2(b)中所標記的192 個點作為角點。反過來,當我們從乙個很遠的距離觀察雪花形狀時(即在較大的尺度下),雖然輪廓的細節已經模糊不清,但卻能夠一眼看出其整體結構,從而傾向於選取圖2(d) 中所標記的12 個點作為角點。此外,圖2(c) 中所標記的角點對於理解雪花形狀也很有幫助。事實上,如果我們不是保守地將自己固定在某個尺度下來觀察物體,便能夠獲得充足的視覺資訊。比如說圖2(b)-2(d) 所呈現的三組角點已經很好地向我們展示了雪花形狀的三個結構層次。這一效果是其中的任意一組角點都無法實現的。

現實生活中視覺問題的複雜性也往往需要我們做到這一點:當我們去參觀某處文化遺跡時,遠遠地就已經開始觀察建築物的外形,然後較近距離時開始注意到門窗、台階、梁柱的建築風格,最後會湊上前去細看門窗上的圖案、石碑上的碑文等。當一部機械人也能夠自主地做到這一點時,說明它已經具備了更高的人工智慧。我們對尺度空間技術的研究也正是朝著這個方向努力。概括地說,「尺度空間」的概念就是在多個尺度下觀察目標,然後加以綜合的分析和理解。

這裡用的是影象來解釋尺度,當然,對於抽象的訊號,理解還是一樣的,不過到時候我們看的工具不是我們人眼或者是攝像機從外表區分了,這時候我們用的工具也可能是時域的分析法,也可能是頻率域的傅利葉變化等分析法,它是我們進一步發現我們感興趣事物的工具。最後貼點數學公式吧,不然不完美:

線性尺度空間技術:

其實現途徑是將一維訊號(如曲線的曲率函式)或二維訊號(如圖象)與高斯函式

g(x,t)=1/(sqrt(t*pi))*exp(-x^2/(4t))
作卷積運算。以一維訊號f(x)為例,

f(x,t)=f(x)*g(x,t)=integration(f(u)g(x-u)du)
其中t被當做尺度引數,其中尺度引數值t由小到大逐漸增加。在演化過程中,訊號上的特徵被提取並加以分析, 形成訊號的尺度空間。

關於尺度空間的理解

通常會聽到尺度變化等這類詞語,看到的也總是一堆的數學公式,有時候真的不知道這到底有啥用,有啥意義,沒有弄懂這些意義,當然就更不可能的理解,不可能去掌握應用它了,現在我才理解,小波變化其實也是一種尺度變化。今天我看到一篇南航數學系寫的關於尺度空間解釋的文章,感覺很通俗易懂,我們不從數學上來推倒什麼是尺...

尺度空間 Scale Space

尺度空間的基本思想 在視覺資訊 影象資訊 處理模型中引入乙個被視為尺度的引數,通過連續變化尺度引數獲得不同尺度下視覺處理資訊,然後綜合這些資訊以深入地挖掘影象的本質特徵。尺度空間方法將傳統的單尺度視覺資訊處理技術納入尺度不斷變化的動態構架中,因此更容易獲得影象的本質特徵。尺度空間生成的目的是模擬影象...

尺度空間理論

看到一篇博文,主要講的是影象金字塔 最後博主關於尺度的選擇很有啟發性,當我們不知道物體的尺度有多大時,可以先定義乙個模板,再與金字塔的每層影象進行匹配。include opencv2 core core.hpp include opencv2 features2d features2d.hpp in...