計算機視覺入門筆記,未完待續

2021-10-23 22:47:21 字數 393 閱讀 8073

計算機視覺主要是使用的深度學習,機器學習的方法來解決一些影象問題。由於輸入進計算機的影象都是矩陣、數字的形式,於是我們需要通過一些方法讓計算機識別這些影象,從而實現一些輔助效果。

基本入門分為cnn(卷積神經網路)主要是分類,包括(alexnet,vgg,resnet,densenet),

分割(unet,fcn)

gan(對抗生成網路),cam和grad-cam(cnn視覺化方法),注意力機制。

莫煩python:

這一部分需要了解基本的卷積層,池化層等基本概念就可以試著跑一跑cnn的網路了。(alexnet,vgg,resnet,densenet)這四種網路結構,尤其是residual block和dense block需要理解原理並且了解**結構。

先看fcn,再看unet

nodejs筆記(未完待續)

1 promise用於非同步處理 function getdata resolve,reject 1000 var p newpromise getdata p.then data 2 async function getdata console.log getdata promiseasync f...

計算機視覺入門筆記

了解一下計算機視覺的基礎知識。常用的程式語言 硬體 常用的開源軟體 越早學越好 和機器學習之間的關係。計算機視覺的應用 做壓縮裡面,ipb 是最常見的,代表的是在壓縮完成之後只會帶表的三中幀。i 幀 p 幀 b 幀。i 幀,叫做關鍵幀,它會吧一張完整的儲存下來,所以 i 幀 不能出錯,出錯就白費了 ...

Shell程式設計筆記(未完待續)

單引號關閉所有有特殊作用的字元 而雙引號只要求shell忽略大多數,除了 美元符號 反引號 反斜槓,這3種特殊字元不被忽略。具體而言 單引號包括的內容均被原樣輸出 雙引號會做變數替換,命令替換和轉義,除此之外原樣輸出 示例 bin bash dt today is singlequote dt is...