計算機視覺裡的多目幾何 day1

2021-07-12 03:18:32 字數 1381 閱讀 4180

帶上「數學」這把斧頭,在立體視覺的世界裡,披荊斬棘。 —佚名

本章用了4天看完,總共40頁,大概10頁/天的進度。最大的感受是,引入projective plane這個數學表達,把2d中的點和線都統一用乙個三元組(3x1向量)來表示,並且從這個層面上說,點和線是共軛的(conjugate)。除了描述點和線,還描述了圓錐曲線(conic),最精彩的地方在於,conic聯絡了點和線。乙個物件集合是,另乙個物件集合是四個層面的變換(transformation),這是本章的兩個研究物件。前者用向量或者矩陣表示,後者全部用矩陣表示。而且對於後者,矩陣的實際意義體現為一種變換(一種動態的變化,而且這種變化與時間無關,是一種瞬間發生的變化),矩陣裡的特徵值理論可以派上用場。

梳理本章的邏輯結構,有利於深入理解兩個物件集合之間的關係,以及集合內部各個物件之間的關係。這種關係總是可以用數學完美地表達出來。對於下一章,這就非常順其自然地推廣了。

對於直線 ax

+by+

c=0 ,對應的表示形式是 =(

a,b,

c)t (記為

l )。對於點 (x

,y) ,對應到投影平面的形式是 (x

,y,1

) (記為

x )。這樣一來,「點在直線上」的原始表達 ax

0+by

0+c=

0 可以表達成 (x

,y,1

)(a,

b,c)

t=0 ,即xt

l=0 。(x

,y,1

) 和(a

,b,c

) 都是齊次的,也就是說,k(

x,y,

1)和(x,

y,1)

表示的是同乙個點,k(

a,b,

c)和(a,

b,c)

表示的是同一條直線。正是因為齊次性,這種表達方式(後面都稱作「投影表示法」)才能夠保持2d中的點和直線的自由度(自由度=2)。所以,通常把(x

,y,1

) 寫成(x

1,x2

,x3)

,後者和前者的關係是(x

1/x3

,x2/

x3,1

) 。

投影表示法的好處:

- 它可以表示無窮遠點。如果x3

=0的話,x1

/x3=

∞,x2

/x3=

∞ ,即為無窮遠點。

- 點在直線上 xt

l=0

- 直線的交點 x=

l1×l

2 - 兩點確定的直線 l=

x1×x

2

計算機視覺 4 1 多視角匹配

人有兩隻眼睛 人有兩隻眼睛的原因是需要對距離進行估計,通過在兩隻眼球的視網膜上成像並融合,人的大腦可以提取場景的三維資訊。通過雙目視覺,可以對場景進行重建,同時由於三維比二維包含的資訊多,可以更好的完成識別和影象分割任務。已知兩幅影象上的乙個點對,那麼可以恢復三維座標。即從光心出發,通過每個影象點的...

攝影測量與計算機視覺 幾何差異和轉換

隨著計算機視覺的發展,攝影測量和計算機視覺逐漸交叉融合,兩個不同學科之間的差異逐漸變小。但是在此處,博主仍舊想記錄一下兩個學科在幾何關係描述上的一些本質差異。一 座標的幾何表示 首先,對於兩個領域來說,最為明顯的乙個差異就是對座標的表示方法。在攝影測量中,通常直接直接使用二維座標或者三維座標對座標進...

計算機視覺關於濾波的處理

一 攝像頭的呼叫 include include using namespace std using namespace cv void main 二 讀取並轉為灰度圖的 讀一張,存入到矩陣,1為rgb三通道,0為灰度圖 cvtcolor imagegrag,imagegrag,cv rgb2gra...