深度學習模型訓練基本步驟

2021-09-12 13:10:02 字數 338 閱讀 4242

原文**這裡

一.資料預處理

二.將資料輸入神經網路(每個神經元先輸入值加權累加再輸入啟用函式作為該神經元的輸出值)正向傳播,得到得分

三.將「得分」輸入誤差函式loss function(正則化懲罰,防止過度擬合),與期待值比較得到誤差,多個則為和,通過誤差判斷識別程度(損失值越小越好)

四.通過反向傳播(反向求導,誤差函式和神經網路中每個啟用函式都要求,最終目的是使誤差最小)來確定梯度向量

五.最後通過梯度向量來調整每乙個權值,向「得分」使誤差趨於0或收斂的趨勢調節(sgd演算法)

六.重複上述過程直到設定次數或損誤差失的平均值不再下降(最低點)

訓練完成

深度學習模型訓練 分類問題。

模型分類問題主要包含二分類和多分類兩種場景。1 二分類為什麼會採用sigmoid啟用函式 模型在實際輸出時值可能不在 0,1 區間,我們需要把模型的輸出對映到 0,1 區間。二分類問題需要採用邏輯回歸的思路解決問題。原因是邏輯回歸服從0 1分布,即 p y 1 x p x p y 0 x 1 p x...

深度學習模型訓練小技巧

這篇文章主要介紹一些在深度學習模型訓練時的一些小技巧。warmup可以理解為預熱 熱身的意思,它的思想是一開始以較小的學習率去更新引數,然後逐步提高學習率。這樣的好處是 有助於減緩模型在初始階段對mini batch的提前過擬合現象,保持分布的平穩 有助於保持模型深層的穩定性。線性warmup nu...

pytorch模型訓練步驟

講解 textcnn模型 1.載入conf檔案 x import module models.model name config x.config dataset,embedding 2.載入model,初始化conf裡面值 model x.model config to config.device...