Googleの拡散型言語モデル「Gemini Diffusion」はどれくらい爆速なのか?

2025年5月21日にGoogleが発表したAIモデル「Gemini Diffusion」は、言語モデルとしては珍しく「拡散モデル」を採用しており、生成速度の速さがアピールされています。インターネット上には、Gemini Diffusionを実際に使ったユーザーによる実使用時の速度報告が投稿されています。
Gemini Diffusion
https://simonwillison.net/2025/May/21/gemini-diffusion/
一般的な言語モデルは自己回帰モデルと呼ばれる手法を採用しており、テキストを1トークンずつ順番に生成しています。一方で、Gemini Diffusionは画像生成モデルなどで広く使われている拡散モデルを採用しており、「ノイズを段階的に洗練させて最終的な成果物を出力する」という動作をします。これにより非常に高速な処理が可能になったほか、「生成プロセス中にエラーを修正できる」というメリットも獲得しています。
Google DeepMindが爆速でテキストを生成する拡散モデル「Gemini Diffusion」を発表 - GIGAZINE

GoogleはGemini Diffusionで1秒当たり1479トークンのテキストを生成できるとアピールしています。

また、Gemini Diffusionは非常に高速ながら「Gemini 2.0 Flash-Lite」に匹敵するベンチマークスコアを記録しています。

ペリカンを用いたAIの性能テストなどで知られるサイモン・ウィリソン氏は、Gemini Diffusionのウェイトリストに参加して実際に使用し、コードの生成にかかった時間を報告しています。以下の動画を再生すると、Gemini Diffusionの速さが一発で理解できます。
「チャットアプリのシミュレート版を構築して」と入力すると、爆速でコードが生成されて画面右側にプレビューも表示されました。画面左下には1秒当たり857トークンを生成できた旨が記されています。表示されているプレビューには「テキストを入力する機能」や「入力されたテキストをチャット風に表示する機能」が実装されており、与えられたタスクを的確にこなせていることが分かります。

さらに、「チャットアプリのペリカン版を作って」という指示にも爆速で応答。1秒当たり727トークンでコードを生成できました。

ちなみに、拡散モデルを用いて言語モデルを構築するというアイデア自体は新しいものではなく、2025年2月にはAI開発企業のInceptionが高速に動作する拡散型言語モデル「Mercury Coder」を発表して話題を呼んでいます。
ノイズから単語を抽出して爆速なコード生成が可能な拡散型の言語モデル「Mercury Coder」 - GIGAZINE

なお、GoogleはGemini Diffusionの発表と同日にスマホでローカル動作する軽量マルチモーダルAIモデル「Gemma 3n」も発表しています。Gemma 3nは拡散モデルではなく従来の言語モデルと同様の自己回帰モデルを採用していますが、メモリ使用量の削減に寄与する技術「Per-Layer Embeddings (PLE)」を採用していることを大きな特徴としており、メモリ容量の少ないスマートフォンでもローカルで動作させることが可能です。Gemma 3nを実際にスマートフォンで動作させる手順は以下の記事で詳しく解説しています。
スマホでローカル動作するGoogle製オープンソースAIモデル「Gemma 3n」登場、今すぐスマホで使う方法はコレ - GIGAZINE

Googleは「Google AI Studio」の大幅なアップデートも実施しており、「Gemini 2.5 Proでのコード生成」「30種類以上の音声での自動読み上げ機能」「Model Context Protocol(MCP)のサポート」といった機能が新たに加わっています。
An upgraded dev experience in Google AI Studio - Google Developers Blog
https://developers.googleblog.com/en/google-ai-studio-native-code-generation-agentic-tools-upgrade/

・関連記事
Googleが月額約3万6000円のAIサブスクプラン「Google AI Ultra」を発表 - GIGAZINE
Googleが画像生成AI「Imagen 4」を発表、最大2Kの画像を生成可能でImagen 3より10倍高速なハイスピード版も登場予定 - GIGAZINE
Googleが動画生成AI「Veo 3」を発表、4K出力可能で音声も同時に生成できる - GIGAZINE
GoogleがAIで映画を作れるツール「Flow」を発表、画像生成AI「Imagen」や動画生成AI「Veo」を統合しシーン生成からカット編集まで実行可能 - GIGAZINE
GmailにAIで返信を生成する「パーソナライズドスマート返信機能」や「Geminiで受信ボックスを片付ける機能」追加へ - GIGAZINE
GoogleがChromeで直接Geminiを使える「Gemini in Chrome」を発表 - GIGAZINE
GoogleのコーディングエージェントAI「Jules」のパブリックベータ版が公開される、Gemini 2.5 Proで強力コーディング - GIGAZINE
Gemini 2.5 Proに実験的な強化推論モード「Deep Think」が追加される - GIGAZINE
コンテンツの制作にGoogleのAIが使われた否かを見分けられる「SynthID Detector」が登場 - GIGAZINE
GoogleがXREALと共同開発するAnroid XR対応スマートグラス「Project Aura」を発表、Android XRの開発キットも進化して対応デバイスも増える予定 - GIGAZINE
ブラウザで職探しや食材の注文ができるAIエージェント「Project Mariner」がGoogleのAIサブスク「Google AI Ultra」で利用可能に - GIGAZINE
・関連コンテンツ
in ソフトウェア, Posted by log1o_hf
You can read the machine translated English article How fast is Google's diffusion langu….