李飛飛計算機視覺課CS231n第二天

2021-10-01 04:51:30 字數 1669 閱讀 5313

1. 影象分類資料和label分別是什麼 影象分類存在的問題與挑戰

影象分類的資料是一張上的畫素點。灰度影象只有乙個通道,而彩色影象有rgb三個通道。

對於計算機來說,它不能辨別出這張**上的物體。所以,我們需要向這個賦予標籤以讓計算機識別。

問題與挑戰:

a. 即使是同乙個物體,拍攝的角度不同,**背後蘊含的資料也是不同的。

b. 不同的光線、背景以及被遮擋等問題也會阻礙計算機正確識別物體。

2. 使用python載入一張彩色,觀察畫素值

from pil import image

########獲取指定畫素點的畫素

defgetpngpix

(pngpath =

"aa.png"

,pixelx =

1,pixely =1)

: img_src = image.

open

(pngpath)

img_src = img_src.convert(

'rgba'

) str_strlist = img_src.load(

) data = str_strlist[pixelx,pixely]

img_src.close(

)return data

print

(getpngpix(

))

3. l1範數,l2範數數學表示式 這兩種度量分別適用於什麼情況

l1範數是指向量中各個元素絕對值之和。

l2範數是指向量各元素的平方和然後求平方根。

l1 是傾向於產生稀疏解,而 l2 傾向於減小引數,儘管都能簡化模型,但是一般來說 l2 模型的抗過擬合的能力更好一點。並且進一步說,l1 是假定引數符合拉普拉斯分布,l2 是假定引數符合高斯分布。

4. 描述近鄰演算法knn演算法的複雜度 為什麼很少使用在影象中以及它存在的問題

複雜度分析:

訓練複雜度:knn

knnkn

n演算法只是將訓練資料及標籤預先儲存,並不涉及某些計算,複雜度為o(1

)o(1)

o(1)

。測試複雜度:對於某個樣本x

xx,需要與標籤資料逐一進行對比,計算量與資料大小有關,複雜度為o(n

)o(n)

o(n)

。存在的問題:

a. 計算量大;

b. 樣本不平衡問題(即有些類別的樣本數量很多,而其它樣本的數量很少);

c. 需要大量的記憶體。

5. 了解cifar10資料集

是由50000個訓練樣本和10000個測試樣本組成的含有十個類別的資料集。

6. 超引數怎麼選擇合適(即資料集如何劃分)

實際資料採集後,為了驗證模型的準確性,我們要人為拆分資料集和測試集。

實際使用中,當演算法在訓練集表現得很完美時,應用到測試集後,往往就會發現表現得不盡如人意。因此,我們還要劃分出驗證集,通過訓練集的訓練,以及驗證集驗證模型的優良程度,最後在測試集作**是比較好的選擇。

這裡又要匯入乙個交叉驗證的概念,因為作為驗證集後,我們就有部分資料損失沒有用上,不免的有點浪費。交叉驗證就不再是固定劃分一塊驗證集了。不過訓練量對比起之前的做法提高了數倍,因此交叉驗證比較適用於小資料集使用。

李飛飛計算機視覺課CS231n第一天

pascal visual object challenge 20 catagories imagenet 22000 catagories and 14 millions images 是一種基於特徵的目標識別。用乙個 stop 標識去匹配另乙個 stop 標識非常困難,因為有很多變化的因素,比如...

CS231N斯坦福計算機視覺公開課筆記

p6 視覺化卷積神經網路 導向反向傳播讓輪廓更明顯,找到識別最大的原始影象 p9 cnn 網路工程的實踐技巧,3 3 卷積,步長為1 padding 1 使得feature map 維度不變。兩個3 3 替換乙個5 5 感受野相同,可以減少引數,非線性變換的次數增多。輸入h w c,c是通道數,要c...

cs231n學習筆記 第三課

1.損失函式 loss function 用於評價分類器表現,變數為 值和實際值 判斷 結果 multiclass svm loss function 考慮第i張,xi為其畫素值,yi為其標籤,s為其分類結 是乙個向量,我們將所有的非目標類別的值與分別與目標類別的值做差,如果結果大於一定值 這裡是 ...