《計算機視覺 模型 學習和推理》一第1章 緒 論

2021-09-23 05:11:03 字數 686 閱讀 3789

緒  論

機器視覺旨在從影象中提取有用的資訊,這已經被證實是乙個極具挑戰性的任務。在過去的四十年裡,成千上萬個聰慧和創造性的大腦致力於這一任務。儘管如此,我們還遠遠沒有能夠建立乙個通用的「視覺機器」。

該問題的部分原因是可視資料複雜性所導致的。考慮圖1-1中的影象。場景中有數百個物體。這些物體幾乎都沒有呈現出「特定」的姿態。幾乎所有的物體都被部分遮擋。對於乙個機器視覺演算法,很難確定某個物體的結束和另乙個物體開始的地方。譬如,背景中的天空和白色建築物之間的邊界上,影象在亮度上幾乎沒有變化。然而,即使沒有物體的邊界或材質的變化,前景中suv後窗上的亮度也有明顯的變化。

如果不是因為乙個論證,我們可能已經對發展有用的計算機視覺演算法的可能**到沮喪。即我們有具體的證據證明計算機視覺是可研究的,因為我們自有的視覺系統能夠毫不費力地處理如圖1-1這樣的複雜影象。如果要求你統計出該影象中的樹的總數或繪製街道布局的草圖,你可以很容易做到這點。甚至你可能通過提取微妙的視覺線索,比如人的種族、車和樹的種類以及天氣等,找出這張**是在世界上哪個位置拍的。

圖1-1 乙個視覺場景包含許多物體,而幾乎所有物體都是部分遮擋的。黑圈所示場景中幾乎沒有亮度的變化指示天空和建築之間的邊界。灰圈所示區域中有很大的亮度變化但這實際上跟亮度沒關係,這裡沒有物體邊界或物體材質的變化

《計算機視覺 模型 學習和推理》一第3章 總結

總結 使用概率分布可以描述全域性狀態和影象資料。為此已經給出了四個分布 伯努利分布 分類分布 一元正態分佈 多元正態分佈 還給出了另外四個分布 貝塔分布 狄利克雷分布 正態逆伽馬分布 正態逆維希特分布 可以用於描述上一組分布的引數的概率分布,因此它們可以描述擬合模型的不確定性。這4對分布有特殊關係 ...

《計算機視覺 模型 學習和推理》 3 10 總結

使用概率分布可以描述全域性狀態和影象資料。為此已經給出了四個分布 伯努利分布 分類分布 一元正態分佈 多元正態分佈 還給出了另外四個分布 貝塔分布 狄利克雷分布 正態逆伽馬分布 正態逆維希特分布 可以用於描述上一組分布的引數的概率分布,因此它們可以描述擬合模型的不確定性。這4對分布有特殊關係 第二組...

《計算機視覺 模型 學習和推理》 3 9 共軛性

貝塔分布可以表徵伯努利分布中引數的概率,與之相似,狄利克雷分布可表徵分類分布引數的分布,同樣的模擬關係也適用於正態逆伽馬分布與一元正態分佈 正態逆維希特分布與多元正態分佈之間。這些配對有很特殊的關係 在每種情況下前乙個分布是後乙個的共軛 貝塔分布與伯努利分布共軛,狄利克雷分布與分類分布共軛。當把乙個...