**:
1.1 計算機視覺到底是什麼?
計算機視覺是一門研究如何讓機器「看」的科學
更進一步的說,就是使用攝像機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形
處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的影象。作為一門科學學科,計算機視覺研究相關
的理論和技術,檢視建立能夠從影象或者多維資料中獲取』資訊』的人工智慧系統。
就是的高度。
為768,每個畫素點都能夠代表768中顏色。
rgba模式、cmyk模式、位圖模式、灰度模式、索引顏色模式、雙色調模式和多通道模式。
或許有機會做更多的學習
容量,其中ipb就是最常見的。
,即解析度越高
戶端然後對其進行解析,最終補充每一幀完整
1.4 攝像機
在實際應用當中,基本上都是通過不同種類的攝像機來獲取資料,然後傳送給服務端(ai server)進行處理,分
類有:1.5 cpu和gpu
我想大家肯定是知道,目前很多人工智慧計算都遷移到gpu上進行,tensorflow甚至還有cpu和gpu版本,所以其
兩者的差別和使用方法,這是繞不開的問題。
廢話少說,先來上圖:
整體對比
cpu在設計上,低延遲,可是低吞吐量,cpu的alu(算數運算單元)雖然少,可是很強大,可以在很少的時鐘
週期內完成算數計算,或許數量少,就可以任性的減少時鐘週期,所以其頻率非常高,能夠達到1.532 ~ 3
(千兆,10的9次方)。大快取容量、複雜的邏輯控制單元也可以減低延遲。
gpu在設計上,高延遲,可是高吞吐量。gpu的特點是有很多的alu和很少的cache. 快取的目的不是儲存後
面需要訪問的資料的,這點和cpu不同,而是為thread提高服務的。如果有很多執行緒需要訪問同乙個相同的資料
,快取會合併這些訪問,然後再去訪問dram(因為需要訪問的資料儲存在dram中而不是cache裡面),獲取資料
後cache會**這個資料給對應的執行緒,這個時候是資料**的角色。但是由於需要訪問dram,自然會帶來延時
的問題。
參考鏈結
指令集架構以及gpu內部的平行計算引擎。
安裝教程自行搜尋腦補就行。
1.6 程式語言 + 數學基礎
等語言那也是甚好的。
一遍,也可以看斯坦福的cs229課程
1.7 計算機視覺的應用
計算機視覺之於未來人工智慧,就好比眼睛之於人的重要性一樣。是未來很多領域自動化獲取資料的主要
渠道之一,也是處理資料的重要工具之一。目前可以預想到的應用主要有如下:
- 無人駕駛
- 無人安防
- 人臉識別
- 文字識別
- 車輛車牌識別
- 以圖搜圖
- vr/ar
- 3d重構
- 醫學影象分析
- 無人機
- more ……
2.1 參考書籍
2.2 公開課
這兩門課我覺得經典的課程,如果認真學完的話,基本上是已經入門了,找一般的工作工作應該是沒有問題。
2.3 **
以看一些里程碑文獻,讓自己能夠更好地理解視覺發展歷程。
將其翻譯成blog也不失為乙個好的學習方法(裝逼方法)。
這兩個**已經足夠了,不要太多,學好才是最關鍵的。
關於深度學習,評價最高的莫過於:《deep learning》written by lan goodfellow and yoshuabengio
購買鏈結,這本ai聖經
我就不多廢話了,攢錢買回去好好修煉吧!
關於開源框架,仁者見仁智者見智,我也免得引起戰爭,所以就羅列給一下個人不成熟的小建議。
當我們需要學習各種經典模型的時候,到**去找資料呢?一般大家都會直接wikipedia
,可是我只想說,
上面的也只是英文版漢譯過來的,最好還是找一手資料,不然你吸收的知識,就不知道是被多少人消化過多
少遍後得來的。當然也是有好的,不過那些大牛都是直接看原版才能得出更加深刻的結論,所以看原版文獻
是一件很重要的學習途徑,不然就永遠裝不了*(學習不到最純正的knowledge)。
5.1 里程碑式的文獻
先熟悉所在方向的發展歷程,歷程中的里程碑式的文獻必須要精讀。
例如,深度學習做目標檢測,rcnn、fast rcnn、fater rcnn、sppnet
、ssd和yolo等模型;又例如,深度學習做目標跟蹤,dlt、so-dlt等等;
再例如,對抗網路gan、cgan、dcgan、lapgan等等。
5.2 文獻**
[arxiv]( :每天去更新一下別人最新的工作
5.3 計算視覺的頂會
5.4 計算機視覺的頂刊
六:總結
無論別人給出多好的資料,最終還是要靠自己踏實下來,對各種知識點細嚼慢嚥。ai 不易,且行且珍惜
我個人對計算機視覺非常感興趣,接下來會不斷的分享各種關於cv的學習心得和乾貨。小白上路,大家如果能施捨一些star或者follow將會是給我最大的動力。
- blog
- github
計算機視覺新手入門 大佬推薦我這樣學習
原 2018年03月21日 14 29 22 貓神戰之貓膩 1.1 計算機視覺到底是什麼?計算機視覺是一門研究如何讓機器 看 的科學 更進一步的說,就是使用攝像機和電腦代替人眼對目標進行識別 跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的影象。作為一門科學學...
計算機視覺入門筆記
了解一下計算機視覺的基礎知識。常用的程式語言 硬體 常用的開源軟體 越早學越好 和機器學習之間的關係。計算機視覺的應用 做壓縮裡面,ipb 是最常見的,代表的是在壓縮完成之後只會帶表的三中幀。i 幀 p 幀 b 幀。i 幀,叫做關鍵幀,它會吧一張完整的儲存下來,所以 i 幀 不能出錯,出錯就白費了 ...
計算機視覺如何入門
目錄二 cv入門基礎 本文內容為計算機視覺入門方法。影象的深度 儲存每個畫素所用的位數,比如常見的8位 16位和24位等。影象的壓縮格式 常見的影象壓縮格式有jpg png和tif等。影象的通道數 常見的有灰度圖 單通道 rgba 四通道,其中a指透明度 yuv和yuyv等。i幀表示關鍵幀,其包含了...