從零使用強化學習訓練AI玩兒遊戲 1 安裝環境

2021-08-21 04:18:41 字數 1401 閱讀 7557

本文目前主要是寫給自己的乙個筆記,接下來這段時間會逐步記錄我是怎麼通過學習使用tensorflow+keras訓練神經網路自己玩兒遊戲,如果能間接幫助到他人就最好不過了,不喜勿噴。

目前準備使用第一層卷積神經網路,第二層lstm的方式通過dqn增強學習的方式來訓練這個神經網路。

我是在windows7上執行的,做完了會把**放到github上

python的學習可以用這個**。

開源遊戲環境gym是乙個國外的開源測試平台,專門用來測試增強學習的,裡面可以呼叫各式各樣的遊戲。可以通過

pip install gym
直接使用上面這個命令巨慢。。。。。使用下面這個命令加入了清華的映象,就超級快,以後只要在使用pip安裝的使用加入gym後面的清華映象進行安裝就巨快。

下面來看看這個gym是怎麼玩兒的 嘿嘿

# -*- coding: utf-8 -*-

if __name__ == '__main__':

print('開始學習')

這個顯然是沒有經過控制的遊戲。

還可以改變遊戲名稱來玩兒其他遊戲,這時候發現通過pip版本能玩兒的遊戲有限,使用pip install -e .[all] 

跑到這裡發現需要安裝tensorflow,但是我這台電腦好像還沒有安裝,所以安裝裝keras的方式裝一下    

到了這裡發現還是有錯誤!!!網上查了很多資料,差點發現windows不支援gym的其他遊戲!

但是最後找到了一行命令完美解決了

好的!今天遊戲這個階段就準備好了~我發現要一邊寫部落格一邊開發還是一件很費時間的事情啊。。。。。。

強化學習已成為AI的主流

2018年最值得注意的人工智慧趨勢之一是強化學習已經成熟,成為構建和訓練統計模型以做有用的事情的主流方法。正如我在今年早些時候解釋的那樣,強化學習在企業ai計畫中的作用正在擴大 該技術突破了傳統的機械人技術,遊戲和模擬領域,現在在it運營管理,能源,醫療保健,商業,運輸和金融領域的各種尖端ai應用中...

強化學習已成為AI的主流

2018年最值得注意的人工智慧趨勢之一是強化學習已經成熟,成為構建和訓練統計模型以做有用的事情的主流方法。正如我在今年早些時候解釋的那樣,強化學習在企業ai計畫中的作用正在擴大 該技術突破了傳統的機械人技術,遊戲和模擬領域,現在在it運營管理,能源,醫療保健,商業,運輸和金融領域的各種尖端ai應用中...

強化學習 訓練過程感知與理解

收斂性的直觀理解 訓練情況的感知 q s a q s,a u q s,a q s,a q s,a epsilon u q s,a q s,a q s a u q s,a 其中,u uu是對q s a q s,a q s,a 真實值的估計 u e q s a e r q s a e r e q s a...