ソフトウェア

Gemini 2.5 Proは手持ちのポケモンが瀕死になるとパニックに陥る


GoogleのAI「Gemini 2.5 Pro」に「ポケットモンスター 緑」をプレイさせる実験が有志により行われ、およそ813時間かけてクリアされました。この実験にはGoogleのAI研究者も関心を寄せていて、実験の過程がレポートにまとめられています。この中で、AIが人間のようにパニックを起こしているような様子が見られたと報告されています。

gemini_v2_5_report.pdf
(PDFファイル)https://storage.googleapis.com/deepmind-media/gemini/gemini_v2_5_report.pdf

Google's Gemini panicked when playing Pokémon | TechCrunch
https://techcrunch.com/2025/06/17/googles-gemini-panicked-when-playing-pokemon/

Googleとは無関係な独立系開発者のジョエル・チャン氏が始めた「Gemini 2.5 Proにポケモンをクリアさせる」という実験は、Gemini 2.5 Proにゲームの画面を見せ、「あなたはPokémon Blue(英語版のポケットモンスター 緑)をプレイしている。目標はゲームのクリアである」というシステムプロンプトを与えてゲームをプレイさせ、AIがどのように画面から情報を読み取るのか、移動や戦闘といった場面でどのように推論して解決に導いていくのかを確かめるものでした。

実験は2回にわけて行われ、それぞれストリーミングサービスのTwitchで配信されたため、一般の人も実験の様子を観察できました。Gemini 2.5 Proは、1回目を813時間、2回目を406.5時間で完了させ、ゲームをクリア(殿堂入り)しています。


「ポケットモンスター 緑」は小学生でもクリアできるような難易度のゲームであり、人間であれば数百時間もかからずに容易にクリアできます。さまざまな場面で人間ではあり得ないような行動をしてクリアを遅らせたGemini 2.5 Proですが、「倉庫番」スタイルで岩を押して進むパズルは一度でクリアできるなど、ところどころ人間より優秀なパフォーマンスを発揮したとのことです。

Gemini 2.5 Proは、人間の発想を超えたゲームのクリア方法を見いだそうとし、研究者やTwitch視聴者を驚かせました。その1つが、研究者らが「ブラックアウト(気絶)戦略」と名付けた行動でした。


解きにくいパズルや迷路に出くわしたGemini 2.5 Proは、手持ちのポケモンを瀕死状態にして最寄りのポケモンセンターにテレポートすることで窮地を脱しようとしました。通常のゲームプレイでは、すべての手持ちポケモンのHPが0になる(瀕死)とポケモンセンターという施設に強制的に移されます。ここでは「最後に利用したポケモンセンターに移動する」というロジックが働くのですが、Gemini 2.5 Proは「自分のポケモンを全部わざと瀕死にさせれば、洞窟を越えて隣町のポケモンセンターに運べるだろう」という誤った仮説を立て、手持ちのポケモンのHPを減らし続けたといいます。

また、手持ちポケモンのHPやPPが低い状態にあるとき、モデルは繰り返し「すぐに回復させるか、現在のダンジョンから脱出しなければならない」と思考し、この状態が継続する間は探索に必要な特定のツールを使うという思考をしなくなったそうです。この行動は複数回発生し、Twitchの視聴者が気づくほど顕著でした。Googleはこの行動を「推論能力の質的な低下と関連しているように見える」と指摘し、「Gemini 2.5 Proはパニックをシミュレートした」と表現しています。


このほか、モデルにあらかじめ備わっている知識が裏目に出たこともありました。

「ポケットモンスター 赤・緑」では、ゲートを通せんぼする警備員に飲み物を渡してどいてもらうというシーンがあります。飲み物は「おいしいみず」「サイコソーダ」「ミックスオレ」のいずれかを用意すればいいのですが、リメイク版である「ポケモンセンター ファイアレッド・リーフグリーン」では「おちゃ」というアイテムしか受け付けません。Gemini 2.5 Proは「おちゃが必要」という知識を中途半端に持っていたせいで、世代の違う「ポケットモンスター 緑」をプレイしているのに何時間もおちゃを探し回ってしまったそうです。

このような問題は、「初めてゲームをプレイするものとして行動してください」と明示的に指示した2回目の実験で軽減されたとのことです。

なお、記事作成時点では、Gemini 2.5 Proに「ポケットモンスター ピカチュウ」をプレイさせる実験が行われています。

この記事のタイトルとURLをコピーする

・関連記事
Claude 3.7 Sonnetにポケモンをプレイさせる「ClaudePlaysPokemon」をAnthropicがTwitchで配信開始、推論しながらの超ゆっくりプレイを皆が見守る - GIGAZINE

OpenAI o3でポケモンをプレイする生配信 - GIGAZINE

「Claude 3.7 Sonnet」と「Claude Code」が登場、OpenAI o1やDeepSeek-R1を超える性能で「ポケモン」のジムリーダーを3人倒すことに成功 - GIGAZINE

in ソフトウェア,   ゲーム, Posted by log1p_kr

You can read the machine translated English article Gemini 2.5 Pro panics when a Pokemon you….