レビュー

スマホでローカル動作するGoogle製オープンソースAIモデル「Gemma 3n」登場、今すぐスマホで使う方法はコレ


Googleがスマートフォン向けの最適化技術を取り込んだオープンソースAIモデル「Gemma 3n」の早期プレビュー版を公開しました。すでにAndroidスマートフォンで簡単に試す方法が用意されていたので、実際に使ってみました。

Gemma 3n - Google DeepMind
https://deepmind.google/models/gemma/gemma-3n/

Announcing Gemma 3n preview: powerful, efficient, mobile-first AI - Google Developers Blog
https://developers.googleblog.com/en/introducing-gemma-3n/

Gemma 3nはスマートフォンやタブレットなどでローカル動作させることを念頭に開発されたAIモデルで、メモリ使用量を大幅に削減できる「Per-Layer Embeddings (PLE)」という技術を採用しています。Gemma 3nのパラメーター数は5Bと8Bの2種類で、Gemma 3nの5Bモデルのメモリ使用量は一般的な2Bモデルと同等、Gemma 3nの8Bモデルのメモリ使用量は一般的な4Bモデルと同等です。

チャットAIの性能を人間に評価させる「Chatbot Arena」でのスコアを比較したグラフが以下。Gemma 3nは「GPT-4.1 nano」や「Llama-4-Maverick-17B-128E-Instruct」を超えるスコアを記録しました。


Google製Androidアプリ「Google AI Edge Gallery」を使えばGemma 3nを簡単に試せるとのことだったので、実際にPixel 8 ProにGoogle AI Edge Galleryをインストールし、Gemma 3nを実行してチャットしてみました。まず、以下のリンクをクリックしてGoogle AI Edge Galleryの配布ページを開きます。

Releases · google-ai-edge/gallery · GitHub
https://github.com/google-ai-edge/gallery/releases

配布ページを開いたら最新版の「ai-edge-gallery.apk 」をタップしてダウンロードします。今回はバージョン1.0.0をダウンロードしました。


警告が表示されたら「ダウンロードを続行」をタップ。


「開く」をタップ。


「インストール」をタップ。


インストールが完了したら「開く」をタップ。


Google AI Edge Galleryのホーム画面はこんな感じ。今回はGemma 3nとチャットしたいので「AI Chat」をタップします。


モデル選択画面が表示されたら「Gemma-3n-E2B-it-int4」をタップ。


「Download&Try」をタップ。


Hugging Faceのログイン画面が表示されたらメールアドレスとパスワードを入力して「Login」をタップします。アカウントを持っていない場合は「Sign Up」をタップして新規作成してください。


「Authorize」をタップ。


ユーザー規約に同意するように求められたら「Open user agreement」をタップ。


以下の画面が表示されたら下方向にスクロールします。


規約とライセンスをよく読んでから「Agree and send request to access rep」をタップ。


「Authorize」をタップ。


すると、アクセスリクエスト画面が表示されます。


ファーストネームとラストネームを入力し、利用規約を読み進めます。


規約に同意するチェックを入れてから「Accept」をタップ。


以下の画面が表示されたら左上の「×」をタップ。


すると、モデルデータのダウンロードが始まります。


ダウンロードは2分くらいで完了しました。後は、画面下部の入力欄にテキストを入力すればGemma 3nが返答してくれます。


試しに「ネギとニンジンで作れる料理のレシピを教えて」と入力して送信ボタンをタップ。


炒め物やみそ汁のレシピを教えてくれました。テキスト生成処理はPixel 8 Proのデバイス上で実行されているのでオフラインでも使えます。


Gemma 3nは画像とテキストの同時入力にも対応しており、「画像の詳細を尋ねる」という操作が可能です。実際に使ってみたいので「Ask Image」をタップ。


モデル選択画面が表示されたら「Gemma-3n-E2B-it-int4」をタップ。


「Try it」をタップ。


チャット画面が表示されました。テキストチャットを試した際にモデルのダウンロードが完了しているので、今回は面倒な同意操作などは不要です。カメラで撮影した写真について尋ねたいので、画面左下の「+」をタップしてから「Take a picture」をタップ。


カメラの使用許可を求められたら「アプリの使用時のみ」をタップ。


詳細を聞きたい物を撮影します。今回はiPhone 13 Proを撮影しました。


「これは何」と入力して送信ボタンをタップ。


すると、「iPhone 13」という間違った回答が返ってきました。カメラやロゴから「iPhone 13」だと判断したそうです。iPhoneというところまでは正解ですが、iPhone 11シリーズ以降のiPhoneには「カメラが3個付いていたらProモデル」という見分け方が存在するので、「Proモデルのどれか」というところまで判断してほしかったところです。


なお、Google AI Edge GalleryはiOS版の開発も進んでいます。また、Gemma 3nに採用されたメモリ使用量削減技術は、2025年後半に登場予定の次世代Gemini Nanoにも採用されるそうです。

この記事のタイトルとURLをコピーする

・関連記事
Googleが単一のGPUで実行できる中では過去最高の大規模言語モデル「Gemma 3」を発表 - GIGAZINE

Gemini 2.5 Proに実験的な強化推論モード「Deep Think」が追加される - GIGAZINE

GoogleのコーディングエージェントAI「Jules」のパブリックベータ版が公開される、Gemini 2.5 Proで強力コーディング - GIGAZINE

GoogleがAIで映画を作れるツール「Flow」を発表、画像生成AI「Imagen」や動画生成AI「Veo」を統合しシーン生成からカット編集まで実行可能 - GIGAZINE

Googleが動画生成AI「Veo 3」を発表、4K出力可能で音声も同時に生成できる - GIGAZINE

Googleが月額約3万6000円のAIサブスクプラン「Google AI Ultra」を発表 - GIGAZINE

Google DeepMindが爆速でテキストを生成する拡散モデル「Gemini Diffusion」を発表 - GIGAZINE

GoogleがChromeで直接Geminiを使える「Gemini in Chrome」を発表 - GIGAZINE

GmailにAIで返信を生成する「パーソナライズドスマート返信機能」や「Geminiで受信ボックスを片付ける機能」追加へ - GIGAZINE

コンテンツの制作にGoogleのAIが使われた否かを見分けられる「SynthID Detector」が登場 - GIGAZINE

in レビュー,   モバイル,   ソフトウェア, Posted by log1o_hf

You can read the machine translated English article Introducing the Google-made open source ….