計算機視覺新手入門

2021-08-28 22:04:17 字數 2774 閱讀 5259

**:

1.1 計算機視覺到底是什麼?

計算機視覺是一門研究如何讓機器「看」的科學

更進一步的說,就是使用攝像機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形

處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的影象。作為一門科學學科,計算機視覺研究相關

的理論和技術,檢視建立能夠從影象或者多維資料中獲取』資訊』的人工智慧系統。

就是的高度。

為768,每個畫素點都能夠代表768中顏色。

rgba模式、cmyk模式、位圖模式、灰度模式、索引顏色模式、雙色調模式和多通道模式。

或許有機會做更多的學習

容量,其中ipb就是最常見的。

,即解析度越高

戶端然後對其進行解析,最終補充每一幀完整

1.4 攝像機

在實際應用當中,基本上都是通過不同種類的攝像機來獲取資料,然後傳送給服務端(ai server)進行處理,分

類有:1.5 cpu和gpu

我想大家肯定是知道,目前很多人工智慧計算都遷移到gpu上進行,tensorflow甚至還有cpu和gpu版本,所以其

兩者的差別和使用方法,這是繞不開的問題。

廢話少說,先來上圖:

整體對比

cpu在設計上,低延遲,可是低吞吐量,cpu的alu(算數運算單元)雖然少,可是很強大,可以在很少的時鐘

週期內完成算數計算,或許數量少,就可以任性的減少時鐘週期,所以其頻率非常高,能夠達到1.532 ~ 3

(千兆,10的9次方)。大快取容量、複雜的邏輯控制單元也可以減低延遲。

gpu在設計上,高延遲,可是高吞吐量。gpu的特點是有很多的alu和很少的cache. 快取的目的不是儲存後

面需要訪問的資料的,這點和cpu不同,而是為thread提高服務的。如果有很多執行緒需要訪問同乙個相同的資料

,快取會合併這些訪問,然後再去訪問dram(因為需要訪問的資料儲存在dram中而不是cache裡面),獲取資料

後cache會**這個資料給對應的執行緒,這個時候是資料**的角色。但是由於需要訪問dram,自然會帶來延時

的問題。

參考鏈結

指令集架構以及gpu內部的平行計算引擎。

安裝教程自行搜尋腦補就行。

1.6 程式語言 + 數學基礎

等語言那也是甚好的。

一遍,也可以看斯坦福的cs229課程

1.7 計算機視覺的應用

計算機視覺之於未來人工智慧,就好比眼睛之於人的重要性一樣。是未來很多領域自動化獲取資料的主要

渠道之一,也是處理資料的重要工具之一。目前可以預想到的應用主要有如下:

- 無人駕駛

- 無人安防

- 人臉識別

- 文字識別

- 車輛車牌識別

- 以圖搜圖

- vr/ar

- 3d重構

- 醫學影象分析

- 無人機

- more ……

2.1 參考書籍

2.2 公開課

這兩門課我覺得經典的課程,如果認真學完的話,基本上是已經入門了,找一般的工作工作應該是沒有問題。

2.3 **

以看一些里程碑文獻,讓自己能夠更好地理解視覺發展歷程。

將其翻譯成blog也不失為乙個好的學習方法(裝逼方法)。

這兩個**已經足夠了,不要太多,學好才是最關鍵的。

關於深度學習,評價最高的莫過於:《deep learning》written by lan goodfellow and yoshuabengio

購買鏈結,這本ai聖經我就不多廢話了,攢錢買回去好好修煉吧!

關於開源框架,仁者見仁智者見智,我也免得引起戰爭,所以就羅列給一下個人不成熟的小建議。

當我們需要學習各種經典模型的時候,到**去找資料呢?一般大家都會直接wikipedia,可是我只想說,

上面的也只是英文版漢譯過來的,最好還是找一手資料,不然你吸收的知識,就不知道是被多少人消化過多

少遍後得來的。當然也是有好的,不過那些大牛都是直接看原版才能得出更加深刻的結論,所以看原版文獻

是一件很重要的學習途徑,不然就永遠裝不了*(學習不到最純正的knowledge)。

5.1 里程碑式的文獻

先熟悉所在方向的發展歷程,歷程中的里程碑式的文獻必須要精讀。

例如,深度學習做目標檢測,rcnn、fast rcnn、fater rcnn、sppnet

、ssd和yolo等模型;又例如,深度學習做目標跟蹤,dlt、so-dlt等等;

再例如,對抗網路gan、cgan、dcgan、lapgan等等。

5.2 文獻**

[arxiv]( :每天去更新一下別人最新的工作
5.3 計算視覺的頂會

5.4 計算機視覺的頂刊

六:總結

無論別人給出多好的資料,最終還是要靠自己踏實下來,對各種知識點細嚼慢嚥。ai 不易,且行且珍惜

我個人對計算機視覺非常感興趣,接下來會不斷的分享各種關於cv的學習心得和乾貨。小白上路,

大家如果能施捨一些star或者follow將會是給我最大的動力。

- blog

- github

計算機視覺新手入門 大佬推薦我這樣學習

原 2018年03月21日 14 29 22 貓神戰之貓膩 1.1 計算機視覺到底是什麼?計算機視覺是一門研究如何讓機器 看 的科學 更進一步的說,就是使用攝像機和電腦代替人眼對目標進行識別 跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的影象。作為一門科學學...

計算機視覺入門筆記

了解一下計算機視覺的基礎知識。常用的程式語言 硬體 常用的開源軟體 越早學越好 和機器學習之間的關係。計算機視覺的應用 做壓縮裡面,ipb 是最常見的,代表的是在壓縮完成之後只會帶表的三中幀。i 幀 p 幀 b 幀。i 幀,叫做關鍵幀,它會吧一張完整的儲存下來,所以 i 幀 不能出錯,出錯就白費了 ...

計算機視覺如何入門

目錄二 cv入門基礎 本文內容為計算機視覺入門方法。影象的深度 儲存每個畫素所用的位數,比如常見的8位 16位和24位等。影象的壓縮格式 常見的影象壓縮格式有jpg png和tif等。影象的通道數 常見的有灰度圖 單通道 rgba 四通道,其中a指透明度 yuv和yuyv等。i幀表示關鍵幀,其包含了...