pascal visual object challenge: 20 catagories
imagenet: 22000 catagories and 14 millions images
是一種基於特徵的目標識別。
用乙個』stop』標識去匹配另乙個』stop』標識非常困難,因為有很多變化的因素,比如相機的角度、遮擋、視角、光線以及目標自身的內在變化。
通過觀察目標的某些對旋轉、尺度縮放、亮度變化等保持不變性特徵(sift特徵),然後把這些特徵與相似的目標進行匹配,這會比匹配整個目標更容易。
a. 裡面有各種特徵來告訴我們這是哪種場景。
b. 這個演算法從的各部分、各畫素抽取特徵,並把他們放在一起作為乙個特徵描述符。
c. 在特徵描述符上做乙個支援向量機。
是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。
hog特徵通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。
提出的目的是為了更好的解決行人檢測的問題。
研究如何在實際中比較合理地設計人體姿態和辨認人體姿態。
資料集增多
質量優化
計算機硬體資料集公升級。
影象分割、影象分類、姿態檢測、目標檢測等等
李飛飛計算機視覺課CS231n第二天
1.影象分類資料和label分別是什麼 影象分類存在的問題與挑戰 影象分類的資料是一張上的畫素點。灰度影象只有乙個通道,而彩色影象有rgb三個通道。對於計算機來說,它不能辨別出這張 上的物體。所以,我們需要向這個賦予標籤以讓計算機識別。問題與挑戰 a.即使是同乙個物體,拍攝的角度不同,背後蘊含的資料...
CS231N斯坦福計算機視覺公開課筆記
p6 視覺化卷積神經網路 導向反向傳播讓輪廓更明顯,找到識別最大的原始影象 p9 cnn 網路工程的實踐技巧,3 3 卷積,步長為1 padding 1 使得feature map 維度不變。兩個3 3 替換乙個5 5 感受野相同,可以減少引數,非線性變換的次數增多。輸入h w c,c是通道數,要c...
cs231n學習筆記 第三課
1.損失函式 loss function 用於評價分類器表現,變數為 值和實際值 判斷 結果 multiclass svm loss function 考慮第i張,xi為其畫素值,yi為其標籤,s為其分類結 是乙個向量,我們將所有的非目標類別的值與分別與目標類別的值做差,如果結果大於一定值 這裡是 ...