キャラクターを維持したまま別のシチュエーションに描き直せる画像編集AI「Qwen-Image-Edit」が登場、文字の描き直しや「被写体の回転」も可能

中国のIT企業・アリババ(阿里巴巴)のAI開発チームが、画像生成AI「Qwen-Image」に基づいて画像編集タスクを拡張し、キャラクターの元の見た目を維持したまま別の情景を描き出すことができる「Qwen-Image-Edit」を発表しました。
Qwen-Image-Edit: Image Editing with Higher Quality and Efficiency | Qwen
https://qwenlm.github.io/blog/qwen-image-edit/

🚀 Excited to introduce Qwen-Image-Edit!
— Qwen (@Alibaba_Qwen) August 18, 2025
Built on 20B Qwen-Image, it brings precise bilingual text editing (Chinese & English) while preserving style, and supports both semantic and appearance-level editing.
✨ Key Features
✅ Accurate text editing with bilingual support
✅… pic.twitter.com/p21KUXoC50
アリババのAI開発チームは大規模言語モデル「Qwen」シリーズや画像生成AI「Qwen VLo」を送り出してきました。2025年8月4日にはOpenAIなどの既存の画像生成AIが苦手とする「テキストの正確な描画」もこなす「Qwen-Image」を発表しました。
画像生成AI「Qwen-Image」登場、OpenAIやFlux超えの高品質画像を生成可能で「複数行の漢字」を自然に描写できる驚異的テキスト描画性能をアピール - GIGAZINE

「Qwen-Image-Edit」は「Qwen-Image」をベースに画像編集タスクを拡張したもので、主に「セマンティック編集&外観編集」「正確なテキスト編集」「強力なベンチマークパフォーマンス」の3点が特徴です。
セマンティック編集とは、入力されたイメージの見た目を損なうことなく情景を編集する機能で、Qwenのマスコットキャラクターであるカピバラを用いた例が公開されています。左端の「Input Image」の下にいるカピバラが「Qwen-Image-Edit」に入力されたカピバラの姿で、プロンプトで絵にいろいろな要素が追加されていて、ポーズも変わっていますが、ベースとなるカピバラの見た目は維持されています。また、シャツの「Qwen」という文字もそのまま正確に描写されています。

これはMBTIによる16の性格類型をテーマにしたプロンプトを使ってカピバラを描写したもの。

また、「Qwen-Image-Edit」はオブジェクトの90度回転だけではなく、180度回転もできます。作例を見ると、服装や髪型の破綻なく回転できていることが分かります。

ポートレートを入力してさまざまなスタイルに変更することも可能です。

外観編集では、特定要素の追加・削除・修正を行えます。以下は看板を追加したもの。

混入した髪の毛を除去。

以下はアルファベットのうち「n」の色だけ青に変更し、他はそのまま維持しています。

背景変更。

服装変更。

他の画像生成AIが苦手とするテキストの扱いも得意とし、文字列の中身を書き換えても破綻しません。

ポスターを編集。文字を変更するだけではなく、最後には女性を男性に変更しています。

縦書きの毛筆風画像でも、修正箇所を指定して編集可能。

さらに、「額縁に入れて部屋に飾る」という編集も可能です。

Qwenチームは、「『Qwen-Image-Edit』が画像生成の分野をさらに進歩させ、ビジュアルコンテンツ生成の技術的障壁を下げ、さらに革新的なアプリケーションを刺激することを願っています」とコメントしています。
モデルデータはHugging Faceで公開されています。
Qwen/Qwen-Image-Edit · Hugging Face
https://huggingface.co/Qwen/Qwen-Image-Edit
・関連記事
画像生成AI「Qwen-Image」登場、OpenAIやFlux超えの高品質画像を生成可能で「複数行の漢字」を自然に描写できる驚異的テキスト描画性能をアピール - GIGAZINE
オープンソースのAIモデル「Qwen3-235B-A22B-Thinking-2507」が公開され主要ベンチマークでOpenAIやGoogleのAIモデルを上回るパフォーマンスを叩き出す - GIGAZINE
Claude Sonnet 4に匹敵するコーディング特化のオープンモデル「Qwen3-Coder」をAlibabaが発表 - GIGAZINE
GPT-4oやo1より高性能な推論モデル「Qwen3」をAlibabaが発表、フラグシップモデルの「Qwen3-235B-A22B」はパラメーター数2350億&アクティブパラメーター数220億 - GIGAZINE
・関連コンテンツ
in ソフトウェア, Posted by logc_nt
You can read the machine translated English article Introducing 'Qwen-Image-Edit,' an image ….