計算機視覺時要面臨乙個挑戰,就是資料的輸入可能會非常大。
假設操作的都是 64×64 的小,實際上,它的資料量是 64×64×3,因為每張都有 3 個顏色通道。如果計算一下的話,可得知資料量為 12288,所以我們的特徵向量維度為 12288。這其實還好,因為 64×64 真的是很小的一張。
如果你要操作更大的,比如一張 1000×1000 的,它足有 1 兆那麼大,但是特徵向量的維度達到了 1000×1000×3,因為有 3 個 rgb 通道,所以數字將會是 300 萬。
如果你要輸入 300 萬的資料量,這就意味著,特徵向量x的維度高達 300 萬。所以在第一隱藏層中,你也許會有1000個隱藏單元,而所有的權值組成了矩陣$}^}$。如果你使用了標準的全連線網路,就像我們在第一門和第二門的課程裡說的,這個矩陣的大小將會是1000×300 萬。因為現在x的維度為3m, 3m通常用來表示 300 萬。這意味著矩陣$}^}$會有 30億個引數,這是個非常巨大的數字。在引數如此大量的情況下,難以獲得足夠的資料來防止神經網路發生過擬合和競爭需求,要處理包含 30 億引數的神經網路,巨大的記憶體需求讓人不太能接受。
但對於計算機視覺應用來說,你肯定不想它只處理小,你希望它同時也要能處理大圖。為此,你需要進行卷積計算,它是卷積神經網路中非常重要的一塊。
(計算機視覺)計算機視覺基礎
opencv cximage cimg freeimage opencv中vc庫的版本與visual studio版本的對應關係 vc8 2005 vc9 2008 vc10 2010 vc11 2012 vc12 2013 vc14 2015 vc15 2017 visual studio中的輔助...
計算機視覺
主講老師 曹洋 課程 視覺 基礎 底 層處理 影象處理 特徵提 取 中 層處理 影象分割 相機標 定 深度 估計 運 動估計 高層處 理 3d 重建 目 標識別 視 覺基 礎 底層 處理 圖 像處理 特徵提取 中層 處理 圖 像分割 相機標定 深度估 計 運動 估計 高層處理 3d重 建 目標 識別...
計算機視覺
眾所周知,計算機不認識影象,只認識數字。為了使計算機能夠 理解 影象,從而具有真正意義上的 視覺 本章我們將研究如何從影象中提取有用的資料或資訊,得到影象的 非影象 的表示或描述,如數值 向量和符號等。這一過程就是特徵提取,而提取出來的這些 非影象 的表示或描述就是特徵。有了這些數值或向量形式的特徵...