阿里開源強化學習研究平台Gym StarCraft

2021-09-23 15:13:10 字數 806 閱讀 2817

星際爭霸一直是遊戲玩家心目中即時戰略類的經典之作,歷時十多年而不衰。而如今它更成為深度強化學習、人工智慧演算法研究的乙個主要平台和工具。因為其蘊含了多智慧型體協作、多工學習、巨集觀策略規劃等複雜問題,一旦取得部分突破和進展,對商業和社會發展都會帶來極大影響。如國外的deepmind、facebook等公司相繼投入大量人力基於它進行通用人工智慧的研究。

在星際爭霸的ai研究中,一直以來缺乏完善的工具鏈和開發環境。今年年初facebook公司發布的torchcraft打通了星際和torch之間的橋梁,但卻不支援主流的python開發語言和tensorflow深度學習框架;早前openai公司發布的gym演算法平台雖然支援眾多遊戲環境下的演算法驗證和對比測試,但卻缺少對星際的支援。

阿里巴巴作為國內領先的大資料、雲計算公司,對以強化學習為代表的人工智慧技術密切關注並投入巨大。針對星際ai的這一現狀,率先開發了一套專業易用的研究平台gym starcraft,並且已經開源。

在gym starcraft中,ai和強化學習研究者可以非常方便地使用python語言來進行深度強化學習智慧型agent的開發,它底層完成了對torchcraft和openai gym的封裝,支援基於tensorflow和keras等主流演算法框架進行開發,僅需幾十行**即可完成乙個基本的智慧型agent的開發。同時,便於評測智慧型agent的有效性,gym starcraft被整合在了openai gym這一主流的強化學習ai評測平台中,支援世界各地的星際ai研究者基於它去進行公平、快捷的效果評估,提供了乙個人工智慧的開放協作研究平台。

強化學習 實驗 Gym環境

本節內容參考 白話強化學習 gym是openai團隊提供的乙個簡單的開源專案,可以快速地實現乙個完整的 s a r a s rightarrow a rightarrow r rightarrow a s a r a 首先我們給python環境中安裝gym包 pip install gym下面給出一...

強化學習 1 gym安裝教程

強化學習實戰 第一講 gym學習及二次開發 gym官方文件 1.安裝 anaconda,建立anconda虛擬環境,參考我的另外兩篇部落格 anaconda3在windows下的安裝與簡單使用 anaconda在ubuntu下的安裝與簡單使用 2.啟用進入 anaconda 虛擬環境 source ...

強化學習 蛇棋遊戲gym環境搭建

學習強化學習精要核心演算法與tensorflow實現這本書中,關於蛇棋遊戲利用gym搭建。遊戲的規則非常簡單,詳細請參考馮超的書 強化學習精要核心演算法與tensorflow實現 下面是遊戲的具體實現 import numpy as np import gym from gym.spaces imp...