本文目前主要是寫給自己的乙個筆記,接下來這段時間會逐步記錄我是怎麼通過學習使用tensorflow+keras訓練神經網路自己玩兒遊戲,如果能間接幫助到他人就最好不過了,不喜勿噴。
目前準備使用第一層卷積神經網路,第二層lstm的方式通過dqn增強學習的方式來訓練這個神經網路。
我是在windows7上執行的,做完了會把**放到github上
python的學習可以用這個**。
開源遊戲環境gym是乙個國外的開源測試平台,專門用來測試增強學習的,裡面可以呼叫各式各樣的遊戲。可以通過
pip install gym
直接使用上面這個命令巨慢。。。。。使用下面這個命令加入了清華的映象,就超級快,以後只要在使用pip安裝的使用加入gym後面的清華映象進行安裝就巨快。
下面來看看這個gym是怎麼玩兒的 嘿嘿
# -*- coding: utf-8 -*-
if __name__ == '__main__':
print('開始學習')
這個顯然是沒有經過控制的遊戲。
還可以改變遊戲名稱來玩兒其他遊戲,這時候發現通過pip版本能玩兒的遊戲有限,使用pip install -e .[all]
跑到這裡發現需要安裝tensorflow,但是我這台電腦好像還沒有安裝,所以安裝裝keras的方式裝一下
到了這裡發現還是有錯誤!!!網上查了很多資料,差點發現windows不支援gym的其他遊戲!
但是最後找到了一行命令完美解決了
好的!今天遊戲這個階段就準備好了~我發現要一邊寫部落格一邊開發還是一件很費時間的事情啊。。。。。。
強化學習已成為AI的主流
2018年最值得注意的人工智慧趨勢之一是強化學習已經成熟,成為構建和訓練統計模型以做有用的事情的主流方法。正如我在今年早些時候解釋的那樣,強化學習在企業ai計畫中的作用正在擴大 該技術突破了傳統的機械人技術,遊戲和模擬領域,現在在it運營管理,能源,醫療保健,商業,運輸和金融領域的各種尖端ai應用中...
強化學習已成為AI的主流
2018年最值得注意的人工智慧趨勢之一是強化學習已經成熟,成為構建和訓練統計模型以做有用的事情的主流方法。正如我在今年早些時候解釋的那樣,強化學習在企業ai計畫中的作用正在擴大 該技術突破了傳統的機械人技術,遊戲和模擬領域,現在在it運營管理,能源,醫療保健,商業,運輸和金融領域的各種尖端ai應用中...
強化學習 訓練過程感知與理解
收斂性的直觀理解 訓練情況的感知 q s a q s,a u q s,a q s,a q s,a epsilon u q s,a q s,a q s a u q s,a 其中,u uu是對q s a q s,a q s,a 真實值的估計 u e q s a e r q s a e r e q s a...