強化學習原理 劉建平 目錄

2021-10-02 19:31:27 字數 637 閱讀 3321

文章

**強化學習(一)模型基礎

**強化學習(二)馬爾科夫決策過程(mdp)

無強化學習(三)用動態規劃(dp)求解

無強化學習(四)用蒙特卡羅法(mc)求解

無強化學習(五)用時序差分法(td)求解無**

強化學習(七)時序差分離線控制演算法q-learning

**強化學習(八)價值函式的近似表示與deep q-learning

**強化學習(九)deep q-learning高階之nature dqn

**強化學習(十)double dqn (ddqn)

**強化學習(十一) prioritized replay dqn

**強化學習(十二) dueling dqn

**強化學習(十三) 策略梯度(policy gradient)

**強化學習(十四) actor-critic

**強化學習(十五) a3c

**強化學習(十六) 深度確定性策略梯度(ddpg)

**強化學習(十七) 基於模型的強化學習與dyna演算法框架

無強化學習(十八) 基於模擬的搜尋與蒙特卡羅樹搜尋(mcts)

無強化學習(十九) alphago zero強化學習原理

強化學習 強化學習基礎

為了應對車載網路中通訊環境快速變化的難題,可以使用強化學習進行解決,這裡對強化學習的基礎進行整理。主要的應用場景為車載網路中資源分配問題。本文源自莫煩python 強化學習章節,有需要請查閱原文 20200413補充了一些內容,來自這篇部落格,是李巨集毅的深度強化學習的筆記。強化學習的主要構成有 a...

強化學習 1 1 0 強化學習介紹

abstract 本文介紹reinforcement learning的具體特點和與其他機器學習演算法不同之處,本文是乙個骨架性的文章,所有專有名詞都保持英文原始單詞,具體內容會在後續中給出詳細解答。keywords reinforcement learning,situation,action,e...

python原理 強化學習 原理與Python實現

強化學習 原理與python實現 出版日期 2019年08月 檔案大小 17.18m 支援裝置 60.00 適用客戶端 圖書簡介 目錄全書分為三個部分。第一部分了解強化學習應用,了解強化學習基本知識,搭建強化學習測試環境。該部分包括 強化學習的概況 強化學習簡單示例 強化學習演算法的常見思想 強化學...