強化學習 gym環境的解讀及使用

2021-10-03 20:10:39 字數 1247 閱讀 4720

分類目錄——強化學習

環境中的方法

環境中一般都會有上面說到的父類中的方法,其中

這裡把關鍵部分放在這,更多的參見 本文全部**

# 訓練

for i_episode in

range

(2000):

observation = env.reset(

) ep_r =

0while

true

:# env.render() # 不進行視覺化可以加速訓練過程,取消注釋可以觀察訓練過程

action = rl.choose_action(observation)

# 選擇動作

observation_, reward, done, info = env.step(action)

# 執行動作

rl.store_transition(observation, action, reward, observation_)

# 儲存 一步 的資訊到記憶庫

ep_r += reward # ep_r用來計算總回報

if total_steps >

500:

# 待到記憶庫中存有一些資訊後,從裡面抽取樣本進行訓練

rl.learn(

)if done:

# 達到結束條件,結束本輪(跳出迴圈)

if i_episode%

20==0:

print

('episode: '

, i_episode,

'ep_r: '

,round

(ep_r,2)

,)break

observation = observation_ # 更新當前狀態

total_steps +=

1

分類目錄——強化學習(更新中)

什麼是gym

gym自定義視覺化環境繪製

gym自定義視覺化環境例項

強化學習:gym環境解讀及使用

從q_learning看強化學習

乙個q_learning強化學習自定義gym環境視覺化例項

tkinter繪製強化學習視覺化環境

參考文獻

openai gym 環境庫

快樂的強化學習3——環境模組gym的呼叫

強化學習 實驗 Gym環境

本節內容參考 白話強化學習 gym是openai團隊提供的乙個簡單的開源專案,可以快速地實現乙個完整的 s a r a s rightarrow a rightarrow r rightarrow a s a r a 首先我們給python環境中安裝gym包 pip install gym下面給出一...

強化學習 蛇棋遊戲gym環境搭建

學習強化學習精要核心演算法與tensorflow實現這本書中,關於蛇棋遊戲利用gym搭建。遊戲的規則非常簡單,詳細請參考馮超的書 強化學習精要核心演算法與tensorflow實現 下面是遊戲的具體實現 import numpy as np import gym from gym.spaces imp...

強化學習 1 gym安裝教程

強化學習實戰 第一講 gym學習及二次開發 gym官方文件 1.安裝 anaconda,建立anconda虛擬環境,參考我的另外兩篇部落格 anaconda3在windows下的安裝與簡單使用 anaconda在ubuntu下的安裝與簡單使用 2.啟用進入 anaconda 虛擬環境 source ...