1. 影象分類資料和label分別是什麼 影象分類存在的問題與挑戰
影象分類的資料是一張上的畫素點。灰度影象只有乙個通道,而彩色影象有rgb三個通道。
對於計算機來說,它不能辨別出這張**上的物體。所以,我們需要向這個賦予標籤以讓計算機識別。
問題與挑戰:
a. 即使是同乙個物體,拍攝的角度不同,**背後蘊含的資料也是不同的。
b. 不同的光線、背景以及被遮擋等問題也會阻礙計算機正確識別物體。
2. 使用python載入一張彩色,觀察畫素值
from pil import image
########獲取指定畫素點的畫素
defgetpngpix
(pngpath =
"aa.png"
,pixelx =
1,pixely =1)
: img_src = image.
open
(pngpath)
img_src = img_src.convert(
'rgba'
) str_strlist = img_src.load(
) data = str_strlist[pixelx,pixely]
img_src.close(
)return data
print
(getpngpix(
))
3. l1範數,l2範數數學表示式 這兩種度量分別適用於什麼情況
l1範數是指向量中各個元素絕對值之和。
l2範數是指向量各元素的平方和然後求平方根。
l1 是傾向於產生稀疏解,而 l2 傾向於減小引數,儘管都能簡化模型,但是一般來說 l2 模型的抗過擬合的能力更好一點。並且進一步說,l1 是假定引數符合拉普拉斯分布,l2 是假定引數符合高斯分布。
4. 描述近鄰演算法knn演算法的複雜度 為什麼很少使用在影象中以及它存在的問題
複雜度分析:
訓練複雜度:knn
knnkn
n演算法只是將訓練資料及標籤預先儲存,並不涉及某些計算,複雜度為o(1
)o(1)
o(1)
。測試複雜度:對於某個樣本x
xx,需要與標籤資料逐一進行對比,計算量與資料大小有關,複雜度為o(n
)o(n)
o(n)
。存在的問題:
a. 計算量大;
b. 樣本不平衡問題(即有些類別的樣本數量很多,而其它樣本的數量很少);
c. 需要大量的記憶體。
5. 了解cifar10資料集
是由50000個訓練樣本和10000個測試樣本組成的含有十個類別的資料集。
6. 超引數怎麼選擇合適(即資料集如何劃分)
實際資料採集後,為了驗證模型的準確性,我們要人為拆分資料集和測試集。
實際使用中,當演算法在訓練集表現得很完美時,應用到測試集後,往往就會發現表現得不盡如人意。因此,我們還要劃分出驗證集,通過訓練集的訓練,以及驗證集驗證模型的優良程度,最後在測試集作**是比較好的選擇。
這裡又要匯入乙個交叉驗證的概念,因為作為驗證集後,我們就有部分資料損失沒有用上,不免的有點浪費。交叉驗證就不再是固定劃分一塊驗證集了。不過訓練量對比起之前的做法提高了數倍,因此交叉驗證比較適用於小資料集使用。
李飛飛計算機視覺課CS231n第一天
pascal visual object challenge 20 catagories imagenet 22000 catagories and 14 millions images 是一種基於特徵的目標識別。用乙個 stop 標識去匹配另乙個 stop 標識非常困難,因為有很多變化的因素,比如...
CS231N斯坦福計算機視覺公開課筆記
p6 視覺化卷積神經網路 導向反向傳播讓輪廓更明顯,找到識別最大的原始影象 p9 cnn 網路工程的實踐技巧,3 3 卷積,步長為1 padding 1 使得feature map 維度不變。兩個3 3 替換乙個5 5 感受野相同,可以減少引數,非線性變換的次數增多。輸入h w c,c是通道數,要c...
cs231n學習筆記 第三課
1.損失函式 loss function 用於評價分類器表現,變數為 值和實際值 判斷 結果 multiclass svm loss function 考慮第i張,xi為其畫素值,yi為其標籤,s為其分類結 是乙個向量,我們將所有的非目標類別的值與分別與目標類別的值做差,如果結果大於一定值 這裡是 ...