AI如何在DOTA2中戰勝職業選手?

2021-09-02 05:42:58 字數 636 閱讀 4870

電子科技大學 格拉斯哥學院 2017級 郭世承

openai利用迴圈神經網路(rnn)中的長短期記憶(lstm)來構建了ai的大腦核心。它精通長時間的資訊儲存記憶以及會自動根據序列進行分類處理和**資料。其實簡單來說本質就和家長教自己的孩子如何做一些簡單的事情一樣,你得教他們分清楚不同事物的好壞,而且你還得學著怎麼教才能讓他們牢牢的記住。

每乙個ai的神經網路都包含著乙個單層1024單元的lstm,可以記錄遊戲的狀態並且做出適當的動作。比如執行乙個釋放技能的操作,ai需要4個指標去判斷(移動、攻擊、釋放技能、使用道具),然後ai還需要捕捉到目標的單位然後判斷和自己的距離(在ai看來這些都是對映在x、y上的座標),然後再去判斷技能釋放的操作和時間最後釋放該技能。openai最終將整個遊戲離散化為每個英雄大約170000次可能的動作(相比西洋棋的35點簡直是天文數字,不比較就不會有傷害)

時至今日,最終新一代的ai開始從自我遊戲中去學習而免去了人類的手把手教學。而為了避免可能會導致ai的訓練迴圈的bug,ai在80%的時間都是在和自己相同的ai對戰,而另外20%的時間則是在和上個版本的自身對戰。這些ai指令在128000個cpu核心和256個gpu上每天無休的反覆執行,平攤到每天遊戲中的訓練量累計大約為正常時間上的180年左右。正是因為機械人不斷地自我學習,自我對抗,他們才能逐漸的打敗人類職業選手。

Dota 2 中安裝包的作用

reborn是dota2的重生客戶端,也就是主客戶端。opengl是顯示卡優化的,應該是微軟的乙個標準,有助於提高遊戲的 fps。vulkan也是顯示卡優化的,是乙個比較廣泛的標準,但是比較新的顯示卡才有 實際上低端顯示卡用了可以優化幀數,高階的效果反而不明顯 premium其實是由於你在steam...

AI單挑Dota 2世界冠軍 被電腦虐哭

openai的機械人剛剛在 dota2 1v1 比賽中戰勝了人類頂級職業玩家 denti。以建設安全的通用人工智慧為己任的 openai,通過 self play 的方式,從零開始訓練出了這個機械人。繼橫掃頂級的人類西洋棋大師和圍棋大師後,計算機如今在風靡全球的電子遊戲dota2中戰勝了世界級的職業...

AI單挑Dota 2世界冠軍 被電腦虐哭

openai的機械人剛剛在 dota2 1v1 比賽中戰勝了人類頂級職業玩家 denti。以建設安全的通用人工智慧為己任的 openai,通過 self play 的方式,從零開始訓練出了這個機械人。繼橫掃頂級的人類西洋棋大師和圍棋大師後,計算機如今在風靡全球的電子遊戲dota2中戰勝了世界級的職業...