深度學習（十六）

1、學習率改變的新方法：剛開始陡公升，後來慢慢下降；其中32是最大的學習率與最小的學習率之比，10代表第乙個epoch公升高，後面九個epoch緩緩下降

2、concat pooling：即將啟用值，啟用值的平均池化，啟用值的最大池化連線在一起

3、注意力機制其實就是對不同的狀態進行加權，這在程式中的具體體現就是編寫了乙個迷你網路，一般只有兩層線性層跟一層非線性層，通過將不同的狀態輸出得個權值的集合。這裡就體現出端到端學習的優點，我們只需要處理資料，選擇合適的結構，設定自己的損失函式就夠了，至於怎麼得到合適的權值，完全交給損失函式。

4、在高維空間中，距離的意義不是特別大，比較常用的度量標準是角度，比如余弦相似度。

《 C 深度剖析》學習日誌十六物件的構造順序

物件的構造順序並不難，但是有很多bug會由物件的構造順序產生，所以我們有必要梳理一下物件的構造順序。我們先提出乙個問題 c 中的類可以定義多個物件，那麼物件構造順序是怎樣的？當程式執行流到達物件的定義語句時進行構造，我們來看下面的結果顯示就是順序執行流影響物件的建立順序。如果使用goto語句來改變...

強化學習十六深度確定性策略梯度 DDPG

在強化學習十五 a3c中，我們討論了使用多執行緒的方法來解決actor critic難收斂的問題，今天我們不使用多執行緒，而是使用和ddqn類似的方法即經驗回放和雙網路的方法來改進actor critic難收斂的問題，這個演算法就是是深度確定性策略梯度 deep deterministic po...

學習linux十六

4.41 靜態檔案過期快取什麼是靜態檔案的過期時間讓之類的靜態檔案，快取在客戶端的瀏覽器中，在沒有過期之前，瀏覽器不請求該。就是為了讓這些有乙個時效。如果伺服器上是已經做了更新，但是客戶端訪問到的還是舊的。如何配置 vi 虛擬主機配置檔案，增加或更改 vi etc nginx conf.d b...

深度學習（十六）

《 C 深度剖析》學習日誌十六 物件的構造順序

強化學習 十六 深度確定性策略梯度 DDPG

學習linux十六

相關推薦

《 C 深度剖析》學習日誌十六物件的構造順序

強化學習十六深度確定性策略梯度 DDPG