世界最強の囲碁AIを開発したDeepMindが「人間を超越したFPSプレイヤー」のAIを開発

投稿日：2018年7月7日

1: 田杉山脈 ★ 2018/07/06(金) 23:56:54.85 _USER

Googleと同じAlphabetを母体に持ち、世界最強の囲碁AI「AlphaGo Zero」を開発した人工知能(AI)開発企業・DeepMindが、ファーストパーソン・シューティング・ゲーム(FPS)で人間を超えた勝率をたたき出すAI「For the Win(FTW)」を開発しました。ただ敵を倒すだけではなく、人間のチームメイトとも協力して有利にゲームをプレイすることができるとのことです。

Capture the Flag: the emergence of complex cooperative agents | DeepMind
https://deepmind.com/blog/capture-the-flag/

人間とゲームをプレイするAIの研究は、2017年にもOpenAI開発のAIが「Dota 2」で人間に勝利するという結果を残し、話題になりました。また、DeepMindも「StarCraft 2」をプレイするAIを研究していたことがあります。

今回、GoogleのDeepMindが開発した「FTW」は、1999年に発売された「Quake III Arena」をプレイ。「Quake III Arena」はマルチプレイヤー向けのFPSで、今でも大会が開かれるほど人気があるタイトルです。この「Quake III Arena」での対戦ルール「Capture the Frag(CTF)」という旗取りゲームを行い、人間と一緒にチームで遊べることを目指して学習を行ったとのこと。

CTFは2つのチームに分かれて対戦するゲームで、相手チームの陣地にある旗を奪って自陣に戻るとポイントが加算されるというもの。単純なルールに見えますが、相手チームに旗を取られた場合は旗を持っているプレイヤーを倒さなければならないなど、状況に応じて狙う相手や動きを変更しなくてはならず、CTFで要求される動きは複雑だと研究チームは評価しています。

戦いの舞台となるマップは同じものを使い続けるのではなく、マッチごとにマップを変更していたとのこと。これによって、FTWはマップのレイアウトを記憶するのではなく、汎用的な戦略を学習していかなければなりません。さらに、AIを人間と同じように成長させるため、従来のゲーム用AIのようにゲーム内でのパラメータを直接読み取ってプレイするのではなく、人間と同じように画面上のピクセルを認識させてエミュレートしたコントローラーで操作をさせています。

DeepMindの研究チームは、40人の人間プレイヤーと30のFTWのエージェントをランダムにマッチさせ、45万回以上CTFをプレイさせました。各エージェント間ではリカレント(回帰型)ニューラルネットワークが形成され、さらにゲームポイントから内発的動機付けを行うように学びます。これによってCTFを高いレベルでプレイするようになります。

以下のムービーで、実際にFTWのエージェントが人間も交えながらCTFをプレイする様子が見られます。
https://www.youtube.com/watch?v=dltN4MxV1RI

以下のグラフはFTWの成長具合を表したもの。横軸がゲーム回数、縦軸はEloレートと呼ばれるプレイヤーの強さを示す数字で、高いほど強いプレイヤーであることを示します。水色線がFTWのEloレートを示していますが、FTWのエージェントがCTFを15万回プレイした段階で既に「平均的な人間プレイヤーのEloレート(Average Humanと書かれた点線)」を超えていて、20万回へ到達しないうちに「強い人間プレイヤーのEloレート(Strong Humanと書かれた点線)」を超えています。CTFを45万回プレイする頃にはトップスコアを記録しています。

以下ソース
2018年07月06日 11時23分
https://gigazine.net/news/20180706-deepmind-capture-the-flag/

引用元: http://egg.5ch.net/test/read.cgi/bizplus/1530889014/

このまとめの続きはコチラ！

-Web系関連記事：プログラミング、開発関連

: セキュリティ人材で大切な資質とは–育成ブームに「苦言」

1: 田杉山脈 ★ 2018/08/14(火) 22:25:42.62 _USER
サイバーセキュリティの重要性が増す中で世界的にセキュリティ人材の不足が叫ばれ、人材育成がブームの様相を見せる。こうした状況に専門家がセキュリティ人材に求められる資質を説くとともに、育成ブームに苦言も呈して…

: 高校の数学に「行列」復活も、国が本腰入れるAI人材教育の詳細が判明

1: 田杉山脈 ★ 2019/05/20(月) 22:11:33.75 _USER
内閣官房の教育再生実行会議（座長・鎌田薫前早稲田大学総長）は2019年5月17日、人工知能（AI）やIoT（インターネット・オブ・シングズ）などを技術の進展に合わせて様々な分野で使いこなせる人材の育成策を盛り込んだ第1…

: さらばVBA！　JavaScriptベースのOffice Scriptプレビュー版が公開

1: デボンレックス(関東・甲信越) [US] 2020/01/27(月) 20:36:34.59 BE:811571704-2BP(2072)
https://ascii.jp/elem/000/004/000/4000725/ https://ascii.jp/img/2020/01/24/3005290/o/d827d5be2385ccc1.jpg WordやExcelに代表されるOfficeスイートは以前から、業務処…

: 無人店にAIガードマン　NTT東など、新潟・上越妙高で

1: へっぽこ立て子＠エリオット ★ 2020/04/01(水) 15:35:59.22 ID:CAP_USER
NTT東日本などは1日から、上越妙高駅西口の無人店舗内に人工知能（AI）を活用した万引き防止サービスを導入した。店内に設置したAI内蔵のカメラで来店客の不審な動きを検知すると、近隣店舗のス…

: Webサーバーの開発元「NGINX」にロシア警察の強制捜査、従業員拘束＆機器押収へ

1: 田杉山脈 ★ 2019/12/13(金) 19:27:36.77 _USER
世界中のウェブサービスで利用される無料かつオープンソースのWebサーバー「nginx」を開発するNGINXがロシア警察からの強制捜査を受けたことがわかりました。この背景には、「ロシア企業がnginxの所有権を主張している」…

PREV: スティーブ・ジョブズとかいう人類史上一番の天才ｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗ
NEXT: 【悲報】中小企業の45％、2020年にWindows 7のサポートが終了することをを知らない

: 2024/11/21

【急募】Memeコインで億る方法

: 2024/11/21

中国の通販サイト、まじで終わってる

: 2024/11/21

【緊急】ビットコイン、1500万円超え

: 2024/11/21

ワイ「そのガジェット乾電池式なのがネックだよね？」敵「乾電池式の方が便利だぞ！」

: 2024/11/21

【悲報】ワイの7年使ったスマホ、ガチでヤバい