1、學習率改變的新方法:剛開始陡公升,後來慢慢下降;其中32是最大的學習率與最小的學習率之比,10代表第乙個epoch公升高,後面九個epoch緩緩下降
2、concat pooling:即將啟用值,啟用值的平均池化,啟用值的最大池化連線在一起
3、注意力機制其實就是對不同的狀態進行加權,這在程式中的具體體現就是編寫了乙個迷你網路,一般只有兩層線性層跟一層非線性層,通過將不同的狀態輸出得個權值的集合。這裡就體現出端到端學習的優點,我們只需要處理資料,選擇合適的結構,設定自己的損失函式就夠了,至於怎麼得到合適的權值,完全交給損失函式。
4、在高維空間中,距離的意義不是特別大,比較常用的度量標準是角度,比如余弦相似度。
《 C 深度剖析》學習日誌十六 物件的構造順序
物件的構造順序並不難,但是有很多bug會由物件的構造順序產生,所以我們有必要梳理一下物件的構造順序。我們先提出乙個問題 c 中的類可以定義多個物件,那麼物件構造順序是怎樣的?當程式執行流到達物件的定義語句時進行構造,我們來看下面的 結果顯示就是順序執行流影響物件的建立順序。如果使用goto語句來改變...
強化學習 十六 深度確定性策略梯度 DDPG
在強化學習 十五 a3c中,我們討論了使用多執行緒的方法來解決actor critic難收斂的問題,今天我們不使用多執行緒,而是使用和ddqn類似的方法 即經驗回放和雙網路的方法來改進actor critic難收斂的問題,這個演算法就是是深度確定性策略梯度 deep deterministic po...
學習linux十六
4.41 靜態檔案過期快取 什麼是靜態檔案的過期時間 讓之類的靜態檔案,快取在客戶端的瀏覽器中,在沒有過期之前,瀏覽器不請求該。就是為了讓這些有乙個時效。如果伺服器上是已經 做了更新,但是客戶端訪問到的還是舊的。如何配置 vi 虛擬主機配置檔案,增加或更改 vi etc nginx conf.d b...