原創: 範 純真學者出神入化 2月24日
本文由純真學者出神入化編譯自:
講述霍夫(hough)變換如何被發明的故事。
hough變換用於檢測數字影象中的直線等幾何特徵,可能是計算機視覺中使用最廣泛的程式之一[1-3]。雖然沒有人列出計算機視覺中使用任何特定演算法或技術的頻率,但我們可以通過注意在google scholar搜尋術語「hough變換」中返回超過22,000次引用, 來了解其受歡迎程度。這是好幾倍於其他經典計算機視覺運算元的引用次數,如sobel運算元[3]或canny邊緣檢測器[4]。
這種變換來自**?你可能會模糊地回憶起它可以追溯到p.v.c的2023年專利,雖然我懷疑很少有讀者真正看過這個專利,其標題頁如圖1所示。如果你這樣做,你可能會驚訝地發現今天使用的變換其實並沒有在那裡描述。實際上,今天的變換不是一下子就被發明的,而是採取了幾個步驟。hough的初步想法與19世紀末數學中乙個不起眼的分支的想法相結合,才產生了我們現在所熟悉的正弦變換。
圖 1以前無人知曉的這一歷史說明了有時候將非顯而易見的相關想法結合起來有多重要。正說明路易斯巴斯德的觀察,「機會有利於準備好的思想」,在20世紀和21世紀仍然像19世紀一樣恰當霍夫的定義
2023年的hough專利是乙個簡潔的奇蹟,只有五頁長,包括數字和索賠。更值得注意的是,沒有定義任何變換的代數方程。此外,本發明的大多數公開內容,包括三個圖中的兩個並不是專用於變換,而是專用於使用諸如差分放大器和鋸齒波發生器之類的部件來實現本發明的模擬電路的描述。
圖 2該專利描述變換的唯一圖形如圖2所示,圖2顯示了三角形中的共線點如何對映到變換平面中的相交線的三個示例。這些交叉點並非偶然:hough明顯地理解了他的幾何結構的理論屬性,他指出,「如果乙個圖形中的一系列點位於一條直線上,那麼平面中的相應直線變換就會有乙個相交。 「
對於hough本人來說,如何看待點到線變換的想法是乙個謎。他一直在尋求,沒有成功。但一天晚上下班回家時,他有乙個莫名其妙但真正的「aha!」見解:將零維點對映到一維直線 ,通過增加維度似乎使問題更複雜 ,但實際上導致了乙個簡單的解決方案,可以使用當時的模擬電子元件[6]實現。
無論這個想法如何產生,hough的2023年專利清楚地揭示了乙個關鍵思想,它是當今使用的變換的基礎:影象平面中的共線點可以通過將它們對映到在變換中相交的幾何結構(對於hough,直線)來識別。但同樣清楚的是,hough所描述的幾何變換和現在為計算機視覺界已經使用了幾十年的幾何變換差別很大。其實,想真正達到目標還需要幾個步驟。羅森菲爾德的定義
2023年,阿茲里爾·羅森菲爾德(azriel rosenfeld)發表了他的計算機視覺基礎書籍「計算機影象處理」。在幾乎是某章節末尾,他提出了乙個「有趣的替代方案,利用點線變換檢測直線」[7]。他引用了hough專利,並且據我所知,第一次以(1)給出的形式定義變換代數,其中(xi,yi)是影象平面中的點,x和y是變換平面的軸:
y=yi*x+xi (1)
他指出,如果一組點(xi,yi),i = 1,...,n是共線的,那麼很容易證明變換平面中的相應線將全部通過單個點。他還用括號表示,如果點(xi,yi)位於幾乎與x軸平行的直線上,那麼這些直線幾乎是平行的,因此它們的交點移動到無窮大的位置。也許從hough的建議 「以正確的角度掃瞄每張兩次」 中得到暗示,羅森菲爾德建議通過在(1)中交換xi和yi來克服這個困難。羅森菲爾德提出了另外一項建議。他再次注意到,存在許多共線這一現象將在變換空間中產生高值。
羅森菲爾德是如何發現hough專利的,現在已經無法確定。眾所周知,hough和羅森菲爾德並不熟悉[6]。羅森菲爾德當然是一位了不起的學者,也許他只是自己找到了這項專利。但無論他如何找到它,我們都可以說羅森菲爾德沿著從霍夫的專利到今天使用的變換的路徑邁出了一大步:他給出了變換的第乙個顯式代數形式,他向電腦科學和計算機視覺社群介紹了乙個最初呈現為模糊的想法. 阿茲里爾·羅森菲爾德(azriel rosenfeld)是計算機影象處理史上的一位**遠矚的人物,他的想法遍及600多篇**和數十本書。但我懷疑很少有人知道他在將計算機視覺中最重要的演算法之一帶到現在的形式中所扮演的角色。
圖 3迂迴
在模式識別研究的早期階段,提出了許多替代的數學方法,這些方法早已被遺忘。其中一種方法是基於積分幾何[8],這是純數學的乙個分支,研究隨機幾何事件的概率。首先在18世紀提出的整體幾何中的典型問題是布馮的針問題:將針放在由木板製成的地板上並計算針將穿過裂縫的概率。其他經典問題是計算線擷取圖形的概率並計算圓的隨機弦的預期長度。這些學科中的一些研究引起了我的注意。對於積分幾何學,現在已經很好地定義了「隨意」丟擲一條線的概念。這意味著在ρ-θ空間中的矩形上取樣均勻分布,該矩形ρ在0-ρmax之間,θ在0和2π之間。對我來說,它可以用來解決斜率和截距的無界值問題。發明霍夫變換
在20世紀60年代後期,我與我的同事richard o. duda和其他人一起為shakey開發了乙個視覺系統,這是乙個由sri international的人工智慧中心建立的移動智慧型機械人。 shakey生活在乙個室內世界,房間裡有幾乎像楔子和立方體一樣的幾何實體。當今的視覺系統提供了雜訊邊緣檢測作為起點,我們試圖利用這種雜訊輸出來建立區域性環境模型,並從已知地標的識別中更新機械人的位置。
我正在研究整體幾何方法是否可以幫助解決這個問題,同時研究羅森菲爾德的計算機影象處理,看看我是否可以從這個開創性的書中獲取任何想法。我對羅森菲爾德對「點線變換」的簡要描述很感興趣,但卻被變換空間在理論上無界的尷尬事實所困擾,需要用到前面提到的不優雅的軸反轉技巧。
然而最終通過考慮直線的正規形式的ρ和θ的有界值,以及由積分幾何學建立的不變性,我提出了乙個新的,我認為更令人滿意的變換:
ρ=xicosθ+yisinθ (2)
ρ從(2)我們可以將影象平面中的點(xi,yi)對映到曲線
圖 4圖4示出了x-y影象平面中的三個點,並指示每個點具有通過它的任意大量的線。所有這些都有一條共同的線路嗎?在水平截獲接近無窮大的過程中,隱含地意識到在變形空間**現的問題。圖5顯示了ρ-θ變換空間中的三個正弦曲線,每個正弦曲線對應於影象平面中的單個點。交點處的ρ和θ值定義了穿過三個點的x-y平面中的線。
圖 5這種新變換不會受到與將點對映到直線相關的理論和計算問題的影響。有限影象平面中的點對映到有限變換空間中的正弦曲線,並沿著線圖指向相交的正弦曲線,而與線的方向或座標軸的選擇無關。
duda和我在2023年向研究界介紹了新的變換[11]。在那篇**中,我們將變換方法的計算複雜度與影象平面中所有點對的詳盡分析的複雜性進行了比較,獲得了簡單的結果,我們還引入了變換的擴充套件,以解決檢測高階分析形狀(如圓)的問題。今天教科書和大學課程普遍教授的變革是2023年杜達和我**中描述的變換。尾聲
這是一群致力於科研傳播的faculty & phd記錄分享點滴思考的平台,這裡有我們在各自領域(機器學習,醫療影像,材料科學,凝聚態物理,生物資訊,光學)涉獵研究的點滴感悟,有我們在國內,海外求學工作奮鬥的酸甜苦辣,亦有偶爾的風月和我們的詩與遠方。
hough變換直線檢測 霍夫圓變換
霍夫圓變換的基本原理和霍夫線變換的原理類似,直線檢測中對應極座標點被三維的圓心點 x,y 以及半徑r即 x,y,r 所代替。對於圓來說,圓心點和半徑就可以確定乙個圓。三維空間中曲線相交於一點的邊緣點集越多,那麼它們經過的共同圓上的畫素點越多,那麼它們經過的共同圓上的畫素點就許多,設定相應的閾值相應的...
霍夫變換檢測直線
對於結構化道路的檢測,常用的方法是採用霍夫變換檢測道路中的直線段。一條直線可以看做是影象上的若干個畫素點組成,也可以用一條直線方程來表示,如 y kx b,那麼霍夫變換檢測直線段其實是將影象畫素點空間變換到引數空間,對於直線來說就是引數 k,b 也可以用來檢測其他形狀如圓和橢圓,只是引數空間表示不一...
霍夫變換檢測直線
對於線性目標提取時,霍夫變換是個很好的手段,博主在這裡做了 實驗,在乙個影象中畫上圓和矩形,通過霍夫變換提取矩形的邊緣。編譯環境為matlab2014a,如下。霍夫變換,找到矩形影象的邊界,用彩色表示出來,矩形和圓不重疊 clc clear all close all i zeros 256,256...