計算機視覺入門筆記

2021-08-15 21:38:50 字數 715 閱讀 6415

了解一下計算機視覺的基礎知識。

常用的程式語言、硬體、常用的開源軟體 (越早學越好), 和機器學習之間的關係。

計算機視覺的應用:

做壓縮裡面, ipb 是最常見的, 代表的是在壓縮完成之後只會帶表的三中幀。 i 幀、p 幀、b 幀。i 幀, 叫做關鍵幀, 它會吧一張完整的儲存下來, 所以 i 幀 不能出錯, 出錯就白費了; p 幀, 指跟上一幀之間的差別, 保留的是跟上乙個幀的差別; b 幀 是雙向的, 代表了跟上一幀和下一幀的差別。

cpu 和 gpu 的差別是什麼?

效能 (低延時性 latency, 延時性越低效能越好) 與吞吐量 (throughput)。

如下圖 :

這張圖來自 wiki 。

要入門和一些數學基礎, 一些要學的東西。 stanford cs231n 課程裡面的已經詳細說明了。

stanford 課程都被大家推薦, 不適合自己, 上知乎看看各位老師、前輩的推薦。找到適合自己的課程。

乙個很有用的** :

如果關心深度學習, 也不需要看太多。 選擇

一、兩本已經足夠。

例如, 深度學習做目標檢測, rcnn、fast rcnn、 faster rcnn、sppnet、ssd 和 yolo 這些模型肯定是要知道的。

又例如, 深度學習做目標跟蹤, dlt、so-dlt 等等。

再例如, 對抗網路 gan、gan、cgan、dcgan、lapgan 等等。

筆記 計算機視覺筆記

計算機視覺是一門研究如何使機器 看 的科學,更進一步的說,就是指用攝影機和計算機代替人眼對目標進行識別 跟蹤和測量等機器視覺,並進一步做影象處理,用計算機處理成為更適合人眼觀察或傳送給儀器檢測的影象 選自維基百科 計算機視覺的研究物件主要是對映到單幅或多幅影象上的三維場景,例如三維場景的重建。計算機...

計算機視覺如何入門

目錄二 cv入門基礎 本文內容為計算機視覺入門方法。影象的深度 儲存每個畫素所用的位數,比如常見的8位 16位和24位等。影象的壓縮格式 常見的影象壓縮格式有jpg png和tif等。影象的通道數 常見的有灰度圖 單通道 rgba 四通道,其中a指透明度 yuv和yuyv等。i幀表示關鍵幀,其包含了...

(計算機視覺)計算機視覺基礎

opencv cximage cimg freeimage opencv中vc庫的版本與visual studio版本的對應關係 vc8 2005 vc9 2008 vc10 2010 vc11 2012 vc12 2013 vc14 2015 vc15 2017 visual studio中的輔助...