AI如何在DOTA2中戰勝職業選手？

電子科技大學格拉斯哥學院 2017級郭世承

openai利用迴圈神經網路(rnn)中的長短期記憶(lstm)來構建了ai的大腦核心。它精通長時間的資訊儲存記憶以及會自動根據序列進行分類處理和**資料。其實簡單來說本質就和家長教自己的孩子如何做一些簡單的事情一樣，你得教他們分清楚不同事物的好壞，而且你還得學著怎麼教才能讓他們牢牢的記住。

每乙個ai的神經網路都包含著乙個單層1024單元的lstm，可以記錄遊戲的狀態並且做出適當的動作。比如執行乙個釋放技能的操作，ai需要4個指標去判斷(移動、攻擊、釋放技能、使用道具)，然後ai還需要捕捉到目標的單位然後判斷和自己的距離(在ai看來這些都是對映在x、y上的座標)，然後再去判斷技能釋放的操作和時間最後釋放該技能。openai最終將整個遊戲離散化為每個英雄大約170000次可能的動作(相比西洋棋的35點簡直是天文數字，不比較就不會有傷害)

時至今日，最終新一代的ai開始從自我遊戲中去學習而免去了人類的手把手教學。而為了避免可能會導致ai的訓練迴圈的bug，ai在80%的時間都是在和自己相同的ai對戰，而另外20%的時間則是在和上個版本的自身對戰。這些ai指令在128000個cpu核心和256個gpu上每天無休的反覆執行，平攤到每天遊戲中的訓練量累計大約為正常時間上的180年左右。正是因為機械人不斷地自我學習，自我對抗，他們才能逐漸的打敗人類職業選手。

AI如何在DOTA2中戰勝職業選手？

Dota 2 中安裝包的作用

AI單挑Dota 2世界冠軍被電腦虐哭

AI單挑Dota 2世界冠軍被電腦虐哭

AI如何在DOTA2中戰勝職業選手？

Dota 2 中安裝包的作用

AI單挑Dota 2世界冠軍 被電腦虐哭

AI單挑Dota 2世界冠軍 被電腦虐哭

相關推薦

AI單挑Dota 2世界冠軍被電腦虐哭

AI單挑Dota 2世界冠軍被電腦虐哭