2025年05月22日 23時00分ソフトウェア

Googleの拡散型言語モデル「Gemini Diffusion」はどれくらい爆速なのか？

2025年5月21日にGoogleが発表したAIモデル「Gemini Diffusion」は、言語モデルとしては珍しく「拡散モデル」を採用しており、生成速度の速さがアピールされています。インターネット上には、Gemini Diffusionを実際に使ったユーザーによる実使用時の速度報告が投稿されています。

Gemini Diffusion
https://simonwillison.net/2025/May/21/gemini-diffusion/

一般的な言語モデルは自己回帰モデルと呼ばれる手法を採用しており、テキストを1トークンずつ順番に生成しています。一方で、Gemini Diffusionは画像生成モデルなどで広く使われている拡散モデルを採用しており、「ノイズを段階的に洗練させて最終的な成果物を出力する」という動作をします。これにより非常に高速な処理が可能になったほか、「生成プロセス中にエラーを修正できる」というメリットも獲得しています。

Google DeepMindが爆速でテキストを生成する拡散モデル「Gemini Diffusion」を発表 - GIGAZINE

GoogleはGemini Diffusionで1秒当たり1479トークンのテキストを生成できるとアピールしています。

また、Gemini Diffusionは非常に高速ながら「Gemini 2.0 Flash-Lite」に匹敵するベンチマークスコアを記録しています。

ペリカンを用いたAIの性能テストなどで知られるサイモン・ウィリソン氏は、Gemini Diffusionのウェイトリストに参加して実際に使用し、コードの生成にかかった時間を報告しています。以下の動画を再生すると、Gemini Diffusionの速さが一発で理解できます。

「チャットアプリのシミュレート版を構築して」と入力すると、爆速でコードが生成されて画面右側にプレビューも表示されました。画面左下には1秒当たり857トークンを生成できた旨が記されています。表示されているプレビューには「テキストを入力する機能」や「入力されたテキストをチャット風に表示する機能」が実装されており、与えられたタスクを的確にこなせていることが分かります。

さらに、「チャットアプリのペリカン版を作って」という指示にも爆速で応答。1秒当たり727トークンでコードを生成できました。

ちなみに、拡散モデルを用いて言語モデルを構築するというアイデア自体は新しいものではなく、2025年2月にはAI開発企業のInceptionが高速に動作する拡散型言語モデル「Mercury Coder」を発表して話題を呼んでいます。

ノイズから単語を抽出して爆速なコード生成が可能な拡散型の言語モデル「Mercury Coder」 - GIGAZINE

なお、GoogleはGemini Diffusionの発表と同日にスマホでローカル動作する軽量マルチモーダルAIモデル「Gemma 3n」も発表しています。Gemma 3nは拡散モデルではなく従来の言語モデルと同様の自己回帰モデルを採用していますが、メモリ使用量の削減に寄与する技術「Per-Layer Embeddings (PLE)」を採用していることを大きな特徴としており、メモリ容量の少ないスマートフォンでもローカルで動作させることが可能です。Gemma 3nを実際にスマートフォンで動作させる手順は以下の記事で詳しく解説しています。

スマホでローカル動作するGoogle製オープンソースAIモデル「Gemma 3n」登場、今すぐスマホで使う方法はコレ - GIGAZINE

Googleは「Google AI Studio」の大幅なアップデートも実施しており、「Gemini 2.5 Proでのコード生成」「30種類以上の音声での自動読み上げ機能」「Model Context Protocol(MCP)のサポート」といった機能が新たに加わっています。

An upgraded dev experience in Google AI Studio - Google Developers Blog
https://developers.googleblog.com/en/google-ai-studio-native-code-generation-agentic-tools-upgrade/

この記事のタイトルとURLをコピーする

・関連コンテンツ

2025年05月22日 23時00分00秒 in AI, ソフトウェア, Posted by log1o_hf

You can read the machine translated English article How fast is Google's diffusion langu….