動手學深度學習(一) 深度學習模型及學習方法簡介

2021-10-09 03:11:55 字數 1004 閱讀 5965

bp神經網路的基礎知識參見機器學習——神經網路(四):bp神經網路

分為三個步驟:

modeling,inference,learning (構建模型、**模型,學習模型)

前向神經網路——standard nn

卷積神經網路——convolutional nn:lenet-5、vgg、alexnet

迴圈神經網路——recurrent neural netwroks

深度信念網路——deep belief network

生成對抗網路——generative adversarial network

深度強化學習網路——deep reinforcement leaning

pytorch

tensorflow

對比:

pytorch:動態計算圖,**通俗易懂,接近於原生的python**,facebook支援,社群活躍

tensorflow:靜態計算圖

詳細對比:pytorch 和 tensorflow 區別

輸入資料 -> model = architecture+parameters ->輸出

pytorch在影象上的作用比較好——影象分類(resnet)

自然語言處理——情感分析、翻譯模型(opennmt-py)、chatbot(回答機械人)

深度強化學習——deep reinforcement learning

預訓練語言模型——gpt2

1.基礎知識

2. 學習pytorch官方tutorrial

3. 學習github上以及各種部落格上的教程

4. 閱讀documentation,使用論壇

5. 跑一些開源的pytorch專案

6. 閱讀深度學習模型的*****

7. 自己創新模型

動手學深度學習(一)

其中 w1 和 w2 是權重 weight b 是偏差 bias 且均為標量。訓練資料 損失函式 通常,我們用訓練資料集中所有樣本誤差的平均來衡量模型 的質量 w 1,w 2,b 為使訓練樣本平均損失最小的解 優化演算法 b 代表每個小批量中的樣本個數 批量大小,batch size 稱作學習率 l...

動手學深度學習

線性回歸的基本要素 模型 為了簡單起見,這裡我們假設 只取決於房屋狀況的兩個因素,即面積 平方公尺 和房齡 年 接下來我們希望探索 與這兩個因素的具體關係。線性回歸假設輸出與各個輸入之間是線性關係 price warea area wage age b price warea area wage a...

動手學深度學習 語言模型

語言模型 一段自然語言文字可以看作是乙個離散時間序列,給定乙個長度為t tt的詞的序列 1,2,t,omega omega 1 2 t 語言模型的目標就是評估該序列是否合理,即計算該序列的概率。假設序列的每個詞是依次生成的,則 p 1,2 t t 1tp t 1,t 1 p 1 p 2 1 p t ...