帶上「數學」這把斧頭,在立體視覺的世界裡,披荊斬棘。 —佚名本章用了4天看完,總共40頁,大概10頁/天的進度。最大的感受是,引入projective plane這個數學表達,把2d中的點和線都統一用乙個三元組(3x1向量)來表示,並且從這個層面上說,點和線是共軛的(conjugate)。除了描述點和線,還描述了圓錐曲線(conic),最精彩的地方在於,conic聯絡了點和線。乙個物件集合是
,另乙個物件集合是
四個層面的變換(transformation),這是本章的兩個研究物件。前者用向量或者矩陣表示,後者全部用矩陣表示。而且對於後者,矩陣的實際意義體現為一種變換(一種動態的變化,而且這種變化與時間無關,是一種瞬間發生的變化),矩陣裡的特徵值理論可以派上用場。
梳理本章的邏輯結構,有利於深入理解兩個物件集合之間的關係,以及集合內部各個物件之間的關係。這種關係總是可以用數學完美地表達出來。對於下一章,這就非常順其自然地推廣了。
對於直線 ax
+by+
c=0 ,對應的表示形式是 =(
a,b,
c)t (記為
l )。對於點 (x
,y) ,對應到投影平面的形式是 (x
,y,1
) (記為
x )。這樣一來,「點在直線上」的原始表達 ax
0+by
0+c=
0 可以表達成 (x
,y,1
)(a,
b,c)
t=0 ,即xt
l=0 。(x
,y,1
) 和(a
,b,c
) 都是齊次的,也就是說,k(
x,y,
1)和(x,
y,1)
表示的是同乙個點,k(
a,b,
c)和(a,
b,c)
表示的是同一條直線。正是因為齊次性,這種表達方式(後面都稱作「投影表示法」)才能夠保持2d中的點和直線的自由度(自由度=2)。所以,通常把(x
,y,1
) 寫成(x
1,x2
,x3)
,後者和前者的關係是(x
1/x3
,x2/
x3,1
) 。
投影表示法的好處:
- 它可以表示無窮遠點。如果x3
=0的話,x1
/x3=
∞,x2
/x3=
∞ ,即為無窮遠點。
- 點在直線上 xt
l=0
- 直線的交點 x=
l1×l
2 - 兩點確定的直線 l=
x1×x
2
計算機視覺 4 1 多視角匹配
人有兩隻眼睛 人有兩隻眼睛的原因是需要對距離進行估計,通過在兩隻眼球的視網膜上成像並融合,人的大腦可以提取場景的三維資訊。通過雙目視覺,可以對場景進行重建,同時由於三維比二維包含的資訊多,可以更好的完成識別和影象分割任務。已知兩幅影象上的乙個點對,那麼可以恢復三維座標。即從光心出發,通過每個影象點的...
攝影測量與計算機視覺 幾何差異和轉換
隨著計算機視覺的發展,攝影測量和計算機視覺逐漸交叉融合,兩個不同學科之間的差異逐漸變小。但是在此處,博主仍舊想記錄一下兩個學科在幾何關係描述上的一些本質差異。一 座標的幾何表示 首先,對於兩個領域來說,最為明顯的乙個差異就是對座標的表示方法。在攝影測量中,通常直接直接使用二維座標或者三維座標對座標進...
計算機視覺關於濾波的處理
一 攝像頭的呼叫 include include using namespace std using namespace cv void main 二 讀取並轉為灰度圖的 讀一張,存入到矩陣,1為rgb三通道,0為灰度圖 cvtcolor imagegrag,imagegrag,cv rgb2gra...