**連線:
注意:交叉驗證和留一法,都只是用來評估誤差的。訓練實際得到的模型是使用所有資料集的。ok
採用的是uci使用最多的iris資料集。特別注意,得到的引數結果是不收斂的。但測試的結果卻是完全正確的。
這裡有些混淆。在吳恩達課程中,不使用批處理的情況下,一般情況會越小,並且最終收斂的是代價函式j,與引數無關。在對率回歸中,與j同等作用的應為l(b) =
1.二維or一維出現頻率最多的元素
for i in range(int(m/k)):
tyy = yy[:,i].flatten()
tyy = tyy.astype(int)
count = np.bincount(tyy)
ypred = np.argmax(count)
得到每一列出現次數最多的元素
2.求逆
np.linalg.inv(d2)
3.np.delete(ax,np.s_[k * 5:k * 5 + 5],axis = 0)
4.通過保證只有正確的下角標
dnum = np.where(y != i)
ttx = x[dnum[0],:]
機器學習(西瓜書)第三章筆記
part5關於多分類學習 以上兩種方法可以從儲存開銷和訓練時間兩個角度來分析模型的優勢。海明距離 就是比較測試例項中與上面的每一行不同的個數 歐式距離 以測試集和第一行為例,sqrt 1 1 2 1 1 2 1 1 2 sqrt 12 關於習題答案 習題3.1 試分析在什麼情況下,在以下式子中不比考...
西瓜書 第三章 線性模型總結
1 線性組合的基本形式是什麼?向量形式怎麼表示?2 線性模型與非線性模型之間有什麼關係?如何通過現象模型得到非線性模型?1 對資料處理 這裡指對離散屬性的量化 例如 身高 的 高 低 可轉化為 身高 的 高 中 低 可轉化為 瓜類 的 西瓜 南瓜 黃瓜 可轉化為,注 若將為無序屬性連續化,則會不恰當...
機器學習(西瓜書)第三章 3 3對率回歸程式設計
常用 1.f csv.reader open watermelon3 0 ch.csv r 2.enumerate 3.concatenate np.concatenate px1,px2,np.ones 50,1 axis 1 4.np.where ans 0.5,是 否 5.import mat...