強化學習 1 gym安裝教程

2021-10-11 21:36:29 字數 930 閱讀 3358

強化學習實戰 第一講 gym學習及二次開發

gym官方文件

1. 安裝 anaconda,建立anconda虛擬環境,參考我的另外兩篇部落格

anaconda3在windows下的安裝與簡單使用

anaconda在ubuntu下的安裝與簡單使用

2. 啟用進入 anaconda 虛擬環境

>> source activate gymlab
gym官方原始碼

4. 進入gym原始碼資料夾,安裝一系列包

>> cd /path/gym

>> pip install –e '.[all]'

裝完後可以將你的gym安裝檔案的目錄寫到環境變數中,一種方法是開啟.bashrc檔案,在末尾加入語句:

export pythonpath=gym目錄:$pythonpath

5. 測試gym,終端輸入指令

1. 啟用進入anaconda虛擬環境

>>> source activate gymlab

2. 執行python

>>> python

3. 建立小車倒立擺模型

import gym

env = gym.make('cartpole-v0')

env.reset()

env.render()

6. 測試效果

三、可能存在的問題

安裝gym的時候需要安裝一些依賴,如果缺少依賴,根據終端提示安裝對應的依賴包

sudo apt-get install -y 依賴包

強化學習 實驗 Gym環境

本節內容參考 白話強化學習 gym是openai團隊提供的乙個簡單的開源專案,可以快速地實現乙個完整的 s a r a s rightarrow a rightarrow r rightarrow a s a r a 首先我們給python環境中安裝gym包 pip install gym下面給出一...

強化學習1

這是第一篇強化學習的學習筆記,會覆蓋幾個基本的概念。程式本身,接受環境的訊號,作出行動,影響環境,形成乙個閉環。價值函式,通過value來評估哪一些狀態和動作是好的,選擇那些能夠提高value的動作和狀態。動作,當agent觀察到環境的狀態後,可以作出一些行動去影響環境,比如自動駕駛的汽車看到路面的...

強化學習系列1 強化學習簡介

2015年10月,alphago在和歐洲冠軍進行的圍棋賽上獲得了5 0的完勝,其後的深度強化學習也隨之火了起來。從本期開始開個新坑,一步步把強化學習的內容捋一遍。強化學習 reinforcement learning 是用來解決連續決策問題的一種方法。針對的模型是馬爾科夫決策過程 markov de...