ソフトウェア

VRAM容量の少ない安めのグラボでも画像生成AI「FLUX.1 Kontext [dev]」を動かせる省メモリ高速版をNVIDIAが開発、VRAM使用量を24GBから7GBまで削減し2.1倍高速動作


FLUX.1 Kontext [dev]」は自然言語で画像を編集可能な画像生成AIモデルで、2025年6月26日にリリースされました。このFLUX.1 Kontext [dev]にはNVIDIAと共同開発したNVIDIA製GPU最適化版が存在しており、基本モデルと比べてVRAM使用量を大幅に削減しつつ処理を高速化することに成功しています。

RTX AI Accelerates FLUX.1 Kontext | NVIDIA Blog
https://blogs.nvidia.com/blog/rtx-ai-garage-flux-kontext-nim-tensorrt/

FLUX.1 Kontext [dev]はFLUX.1 Kontextシリーズのオープンウェイトモデル版として開発されたモデルで、画像の特徴を保ったままプロンプト通りの編集を施すことを得意としています。また、FLUX.1 Kontext [dev]には高度な自然言語理解能力が備わっており、いわゆる「呪文」ではなく自然言語での指示が可能です。

高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル - GIGAZINE


FLUX.1 Kontext [dev]の基本モデルのVRAM使用量は24GBで、実行するには大量のVRAMを搭載した高価なグラフィックボードが必要です。一方で、NVIDIAのTensorRTを用いてFP8に量子化したモデルはVRAM使用量が12GBにまで削減され、FP4に量子化したモデルはVRAM使用量がわずか7GBにまで抑えられました。


FP4での演算にはNVIDIAのGeForce RTX 50シリーズが対応しています。FLUX.1 Kontext [dev]の基本モデルを実行する場合はVRAM容量32GBのGeForce RTX 5090が必要ですが、FP4モデルならVRAM容量16GBのGeForce RTX 5060 Tiで実行することができます。


各グラフィックボードの実売価格は以下の通り。GeForce RTX 5090は40万円以上で売られています。

Amazon | ZOTAC GAMING GeForce RTX 5090 SOLID グラフィックスカード ZT-B50900D-10P VD8992 | ZOTAC | グラフィックボード 通販


一方でGeForce RTX 5060 Tiなら8万円前後で入手可能です。

Amazon | ZOTAC GAMING GeForce RTX 5060 Ti 16GB Twin Edge グラフィックスボード ZT-B50620E-10M VD9182 | ZOTAC | グラフィックボード 通販


量子化には高速化のメリットもあり、FP8モデルは基本モデルと比べて2倍、FP4モデルは2.1倍の速度で実行できます。量子化には「SVDQuant」という手法を活用しており、品質を保ちつつモデルサイズを削減しているそうです。


FLUX.1 Kontext [dev]の基本モデルと量子化モデルは以下のリンク先で配布されています。

black-forest-labs/FLUX.1-Kontext-dev · Hugging Face
https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev

この記事のタイトルとURLをコピーする

・関連記事
画像生成AI「Stable Diffusion 3.5 Large」の18GBを超えるVRAM使用量を40%も削減して11GBにする新技術をNVIDIAが公開 - GIGAZINE

高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル - GIGAZINE

高品質かつ高速な画像生成AI「FLUX.1 Kontext」が登場したので使ってみた、テキストと画像の入力に対応しアニメ風も実写風も生成可能 - GIGAZINE

NVIDIAが推論AIを低コスト・高効率で稼働するための高速化ライブラリ「NVIDIA Dynamo」を公開、DeepSeek-R1を30倍に高速化可能とアピール - GIGAZINE

AppleがNVIDIAとの共同研究で大規模言語モデルのパフォーマンス高速化の成果を発表 - GIGAZINE

画像生成AIをノートPCでどれくらいの速度で動かせるのか、「Razer Blade 16」のVRAM容量16GB「GeForce RTX 4090 Laptop」で実際に試してみたよレビュー - GIGAZINE

in ソフトウェア,   ハードウェア, Posted by log1o_hf

You can read the machine translated English article NVIDIA has developed a memory-saving, hi….