1997 年,「深藍」在西洋棋上擊敗人類冠軍卡程式設計客棧斯帕羅夫的時候,人們說來一盤圍棋啊,結果有了alphago橫掃人類頂尖高手李世石、柯潔。這時候,有人說來一盤「星際」啊……
結果,還不到三年,《星際爭霸2》又被ai拿程式設計客棧下,而且人類輸得幾乎體無完膚!
北京時間 1 月 25 日凌晨,google deepmind的最新ai人工智慧程式「alphastar」以兩個5: 0 連續血洗《星際爭霸2》職業選手tlo、mana,只是在隨後的一場表現賽中輸給了mana。
其中,tlo是liquid戰隊的蟲族選手,目前世界排名第68,mana則是 2018 年wsc大賽的奧斯汀站亞軍,神族選手,世界排名第19。
這次是alphastar首次公開亮相,比賽用的遊戲版本是4.6.2,只進行神族內戰,固定在catalyst le地圖。
尤其令人稱奇的是,alphastar與兩位人類對手的比賽相隔只有兩周,就迅速自學成才,對戰tlo時雖然完勝但表現還相當菜鳥,而對戰mana的時候已經有了幾乎的完美,非人類的操作讓人猝不及防。
deepmind科學家oriol vinyals、d**id silver介紹說,alphastar的訓練首先是模仿學習,訓練大量的比賽回放資料,讓ai通過觀察乙個人所處的環境,盡可能地模仿某個特定的動作,從而理解遊戲基本知識。
然後使用「alpha league」迴圈比賽方法,先對比從人類資料中訓練出來的神經網路,然後逐次迭代,產生新的agent和分支,使其發展壯大。
接下來,這些agent通過強化學習過程與alpha league中的其他競爭對手進行比賽,盡可能有效地擊敗所有這些不同的策略,並調整個人學習目標,鼓勵競爭對手朝特定方式演進,比如說獲得特定獎程式設計客棧勵。
最後在alpha league中選擇最不容易被利用的agent,稱之為「the nash of league」,去挑戰人skkfwv類。
至於為何選擇《星際爭霸2》,主要是因為這款遊戲具備策略性、競爭性的特性skkfwv,需要即時做出大量決策,是非常有趣和複雜的遊戲,在全球都很火爆,每年都有大量的比賽,有著海量的玩家基礎。
本文標題: 1:10!《星際爭霸2》淪陷 人類被ai血洗
本文位址:
深度分析《星際爭霸2》
星際2 可是我期待了12年的遊戲,因為 星際1 曾經在我年少的時候,帶給我人生最快樂的記憶。上週我也稍微頹廢了一天玩了星際2的戰役模式,並結合之前玩對戰模式的一些經驗來給大家分析一下 星際2 這篇分析主要有四部分組成 戰役模式,對戰模式,與星際1的比較和與魔獸3的比較。主要有兩部分 劇情 星際2的劇...
星際爭霸2 Protess
官網上只放出了 protess的一些資料,挑一些有意思的說說。在星際1裡面龍騎士dragoon是傷殘老兵在駕駛著的一副機器骨架,到了2光榮的protess人民的科技更上一層樓,賦予了dragoon更厚的離子盔甲以及新的 雙管機槍 暫且這麼叫著。讓人感覺像是龍騎gg與人族機械人gg的斷背後代。同時賦予...
PySC2 星際爭霸 學習環境搭建
pysc2是deepmind開發的星際爭霸 學習環境 sc2le 的python元件。它封裝blizzard entertainment的星際爭霸 機器學習api,提供python 增強學習環境。pysc2提供了增強學習agents與星際爭霸 互動的介面,得到observations以及傳送acti...