計算機視覺新手入門

**：

1.1 計算機視覺到底是什麼？

計算機視覺是一門研究如何讓機器「看」的科學

更進一步的說，就是使用攝像機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺，並進一步做圖形

處理，使電腦處理成為更適合人眼觀察或傳送給儀器檢測的影象。作為一門科學學科，計算機視覺研究相關

的理論和技術，檢視建立能夠從影象或者多維資料中獲取』資訊』的人工智慧系統。

就是的高度。

為768，每個畫素點都能夠代表768中顏色。

rgba模式、cmyk模式、位圖模式、灰度模式、索引顏色模式、雙色調模式和多通道模式。

或許有機會做更多的學習

容量，其中ipb就是最常見的。

，即解析度越高

戶端然後對其進行解析，最終補充每一幀完整

1.4 攝像機

在實際應用當中，基本上都是通過不同種類的攝像機來獲取資料，然後傳送給服務端（ai server）進行處理，分

類有：1.5 cpu和gpu

我想大家肯定是知道，目前很多人工智慧計算都遷移到gpu上進行，tensorflow甚至還有cpu和gpu版本，所以其

兩者的差別和使用方法，這是繞不開的問題。

廢話少說，先來上圖：

整體對比

cpu在設計上，低延遲，可是低吞吐量，cpu的alu（算數運算單元）雖然少，可是很強大，可以在很少的時鐘

週期內完成算數計算，或許數量少，就可以任性的減少時鐘週期，所以其頻率非常高，能夠達到1.532 ~ 3

（千兆，10的9次方）。大快取容量、複雜的邏輯控制單元也可以減低延遲。

gpu在設計上，高延遲，可是高吞吐量。gpu的特點是有很多的alu和很少的cache. 快取的目的不是儲存後

面需要訪問的資料的，這點和cpu不同，而是為thread提高服務的。如果有很多執行緒需要訪問同乙個相同的資料

，快取會合併這些訪問，然後再去訪問dram（因為需要訪問的資料儲存在dram中而不是cache裡面），獲取資料

後cache會**這個資料給對應的執行緒，這個時候是資料**的角色。但是由於需要訪問dram，自然會帶來延時

的問題。

參考鏈結

指令集架構以及gpu內部的平行計算引擎。

安裝教程自行搜尋腦補就行。

1.6 程式語言 + 數學基礎

等語言那也是甚好的。

一遍，也可以看斯坦福的cs229課程

1.7 計算機視覺的應用

計算機視覺之於未來人工智慧，就好比眼睛之於人的重要性一樣。是未來很多領域自動化獲取資料的主要

渠道之一，也是處理資料的重要工具之一。目前可以預想到的應用主要有如下：

- 無人駕駛

- 無人安防

- 人臉識別

- 文字識別

- 車輛車牌識別

- 以圖搜圖

- vr/ar

- 3d重構

- 醫學影象分析

- 無人機

- more ……

2.1 參考書籍

2.2 公開課

這兩門課我覺得經典的課程，如果認真學完的話，基本上是已經入門了，找一般的工作工作應該是沒有問題。

2.3 **

以看一些里程碑文獻，讓自己能夠更好地理解視覺發展歷程。

將其翻譯成blog也不失為乙個好的學習方法（裝逼方法）。

這兩個**已經足夠了，不要太多，學好才是最關鍵的。

關於深度學習，評價最高的莫過於：《deep learning》written by lan goodfellow and yoshuabengio

購買鏈結，這本ai聖經我就不多廢話了，攢錢買回去好好修煉吧！

關於開源框架，仁者見仁智者見智，我也免得引起戰爭，所以就羅列給一下個人不成熟的小建議。

當我們需要學習各種經典模型的時候，到**去找資料呢？一般大家都會直接wikipedia，可是我只想說，

上面的也只是英文版漢譯過來的，最好還是找一手資料，不然你吸收的知識，就不知道是被多少人消化過多

少遍後得來的。當然也是有好的，不過那些大牛都是直接看原版才能得出更加深刻的結論，所以看原版文獻

是一件很重要的學習途徑，不然就永遠裝不了*（學習不到最純正的knowledge）。

5.1 里程碑式的文獻

先熟悉所在方向的發展歷程，歷程中的里程碑式的文獻必須要精讀。例如，深度學習做目標檢測，rcnn、fast rcnn、fater rcnn、sppnet 、ssd和yolo等模型；又例如，深度學習做目標跟蹤，dlt、so-dlt等等；再例如，對抗網路gan、cgan、dcgan、lapgan等等。

5.2 文獻**

[arxiv]( ：每天去更新一下別人最新的工作

5.3 計算視覺的頂會

5.4 計算機視覺的頂刊

六：總結

無論別人給出多好的資料，最終還是要靠自己踏實下來，對各種知識點細嚼慢嚥。ai 不易，且行且珍惜

我個人對計算機視覺非常感興趣，接下來會不斷的分享各種關於cv的學習心得和乾貨。小白上路，

大家如果能施捨一些star或者follow將會是給我最大的動力。

- blog

- github

計算機視覺新手入門大佬推薦我這樣學習

原 2018年03月21日 14 29 22 貓神戰之貓膩 1.1 計算機視覺到底是什麼？計算機視覺是一門研究如何讓機器看的科學更進一步的說，就是使用攝像機和電腦代替人眼對目標進行識別跟蹤和測量等機器視覺，並進一步做圖形處理，使電腦處理成為更適合人眼觀察或傳送給儀器檢測的影象。作為一門科學學...

計算機視覺入門筆記

了解一下計算機視覺的基礎知識。常用的程式語言硬體常用的開源軟體越早學越好和機器學習之間的關係。計算機視覺的應用做壓縮裡面,ipb 是最常見的,代表的是在壓縮完成之後只會帶表的三中幀。i 幀 p 幀 b 幀。i 幀,叫做關鍵幀,它會吧一張完整的儲存下來,所以 i 幀不能出錯,出錯就白費了 ...

計算機視覺如何入門

目錄二 cv入門基礎本文內容為計算機視覺入門方法。影象的深度儲存每個畫素所用的位數，比如常見的8位 16位和24位等。影象的壓縮格式常見的影象壓縮格式有jpg png和tif等。影象的通道數常見的有灰度圖單通道 rgba 四通道，其中a指透明度 yuv和yuyv等。i幀表示關鍵幀，其包含了...

計算機視覺新手入門

計算機視覺新手入門 大佬推薦我這樣學習

計算機視覺入門筆記

計算機視覺如何入門

相關推薦

計算機視覺新手入門大佬推薦我這樣學習