李飛飛計算機視覺課CS231n第一天

2021-10-01 03:37:11 字數 604 閱讀 4171

pascal visual object challenge: 20 catagories

imagenet: 22000 catagories and 14 millions images

是一種基於特徵的目標識別。

用乙個』stop』標識去匹配另乙個』stop』標識非常困難,因為有很多變化的因素,比如相機的角度、遮擋、視角、光線以及目標自身的內在變化。

通過觀察目標的某些對旋轉、尺度縮放、亮度變化等保持不變性特徵(sift特徵),然後把這些特徵與相似的目標進行匹配,這會比匹配整個目標更容易。

a. 裡面有各種特徵來告訴我們這是哪種場景。

b. 這個演算法從的各部分、各畫素抽取特徵,並把他們放在一起作為乙個特徵描述符。

c. 在特徵描述符上做乙個支援向量機。

是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。

hog特徵通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。

提出的目的是為了更好的解決行人檢測的問題。

研究如何在實際中比較合理地設計人體姿態和辨認人體姿態。

資料集增多

質量優化

計算機硬體資料集公升級。

影象分割、影象分類、姿態檢測、目標檢測等等

李飛飛計算機視覺課CS231n第二天

1.影象分類資料和label分別是什麼 影象分類存在的問題與挑戰 影象分類的資料是一張上的畫素點。灰度影象只有乙個通道,而彩色影象有rgb三個通道。對於計算機來說,它不能辨別出這張 上的物體。所以,我們需要向這個賦予標籤以讓計算機識別。問題與挑戰 a.即使是同乙個物體,拍攝的角度不同,背後蘊含的資料...

CS231N斯坦福計算機視覺公開課筆記

p6 視覺化卷積神經網路 導向反向傳播讓輪廓更明顯,找到識別最大的原始影象 p9 cnn 網路工程的實踐技巧,3 3 卷積,步長為1 padding 1 使得feature map 維度不變。兩個3 3 替換乙個5 5 感受野相同,可以減少引數,非線性變換的次數增多。輸入h w c,c是通道數,要c...

cs231n學習筆記 第三課

1.損失函式 loss function 用於評價分類器表現,變數為 值和實際值 判斷 結果 multiclass svm loss function 考慮第i張,xi為其畫素值,yi為其標籤,s為其分類結 是乙個向量,我們將所有的非目標類別的值與分別與目標類別的值做差,如果結果大於一定值 這裡是 ...