logistic regression模型:y』 = σ(wtx+b),記住使用的啟用函式σ( )是sigmoid函式。
損失函式:l(y』,y) = -[y·log(y』)+(1-y)·log(1-y』)]衡量**值y』與真實值y的差距,越小越好。
代價函式:損失均值,j(w,b) = 1/m·σmi=1l(y』(i),y(i)),是w和b的函式,學習的過程就是尋找w和b使得j(w,b)最小化的過程。求最小值的方法是用梯度下降法。
訓練模型的步驟:
初始化w和b
指定learning rate和迭代次數
每次迭代,根據當前w和b計算對應的梯度(j對w,b的偏導數),然後更新w和b
迭代結束,學得w和b,帶入模型進行**,分別測試在訓練集合測試集上的準確率,從而評價模型
神經網路模型
神經網路往往不需要人為的構造資料特徵,因為乙個神經元就可以看做是原始資料的不同特徵的組合,在神經元數目足夠大,層數足夠多的情況下,是很容易準確的進行分類的.神經網路是由具有適應性的簡單單元組成的廣泛並行互連的網路,它的組織能夠模擬生物神經系統對真實世界物體所做出的互動反應 神經元模型 m p神經元模...
神經網路語言模型
基於計數的n gram語言模型 出現的問題 1 資料稀疏,有些資料未出現過 2 忽略語義的相關性,如 無聊 與 枯燥 雖然語義相似,但無法共享資訊。詞語表示為 one hot表示法。基於分布式表示的n gram語言模型 出現的問題 1 詞向量 如何將每個詞對映到實數向量空間中的乙個點 2 f函式的設...
搭建神經網路模型
簡單例子 先說模型搭建,後面發布模型訓練,最後模型 分類 in channel 輸入彩色為3 out channel 卷積核個數 一般與層數相同 kernel size 卷積核大小 stride 1 padding 0 self.conv1 nn.conv2d 3,6,5 16個卷積核,大小尺寸為 ...