世界最強の囲碁AI「AlphaGo Zero」を開発したDeepMindが、ファーストパーソン・シューティング・ゲーム(FPS)で人間を超えた勝率をたたき出すAI「For the Win(FTW)」を開発した。
ただ敵を倒すだけではなく、人間のチームメイトとも協力して有利にゲームをプレイすることができるとのことです。
今回、GoogleのDeepMindが開発した「FTW」は、1999年に発売された「Quake III Arena」をプレイ。「Quake III Arena」はマルチプレイヤー向けのFPSで、今でも大会が開かれるほど人気があるタイトルです。この「Quake III Arena」での対戦ルール「Capture the Frag(CTF)」という旗取りゲームを行い、人間と一緒にチームで遊べることを目指して学習を行ったとのこと。
CTFは2つのチームに分かれて対戦するゲームで、相手チームの陣地にある旗を奪って自陣に戻るとポイントが加算されるというもの。単純なルールに見えますが、相手チームに旗を取られた場合は旗を持っているプレイヤーを倒さなければならないなど、状況に応じて狙う相手や動きを変更しなくてはならず、CTFで要求される動きは複雑だと研究チームは評価しています。
戦いの舞台となるマップは同じものを使い続けるのではなく、マッチごとにマップを変更していたとのこと。これによって、FTWはマップのレイアウトを記憶するのではなく、汎用的な戦略を学習していかなければなりません。さらに、AIを人間と同じように成長させるため、従来のゲーム用AIのようにゲーム内でのパラメータを直接読み取ってプレイするのではなく、人間と同じように画面上のピクセルを認識させてエミュレートしたコントローラーで操作をさせています。
DeepMindの研究チームは、40人の人間プレイヤーと30のFTWのエージェントをランダムにマッチさせ、45万回以上CTFをプレイさせました。各エージェント間ではリカレント(回帰型)ニューラルネットワークが形成され、さらにゲームポイントから内発的動機付けを行うように学びます。これによってCTFを高いレベルでプレイするようになります。
続きはソース元で
http://gigazine.net/news/20180706-deepmind-capture-the-flag/
続きを読む