ソフトウェア

ByteDanceが画像生成AI「Seedream 4.0」をリリース、4K解像度の画像を生成可能&画像編集機能も備えてGoogleやOpenAIを一部テストで上回る


TikTok運営元のByteDanceが画像生成AI「Seedream 4.0」をリリースしました。Seedream 4.0は最大4Kの画像を生成可能で、単純な「テキストからの画像生成」だけでなくモデルの知識や推論を活用した画像生成にも対応しています。さらに、高品質な画像編集機能も備えており、各種ベンチマークではGoogleやOpenAIの製品を上回るスコアを記録しています。

Seedream 4.0
https://seed.bytedance.com/en/seedream4_0

Seedream 4.0では入力した画像の特徴を引き継ぎつつ新たな画像を生成することが可能。例えば、以下の画像とともに「画像を参考に、女の子の外見や服装は変更せずに『上から撮影した写真』『見上げながら撮影した写真』『背後から撮影した写真』を生成して(Refer to this image, generate three images from different views:360-degree overhead view, an elevated view, and a back view. Don't change the girl's appearance and outfit.)」というテキストを入力します。


生成結果が以下。被写体の見た目や服装、髪型、周囲の景色などを維持できています。


ロゴ画像を入力して、複数の製品画像を生成することもできます。


生成結果はこんな感じ。紙袋や帽子などにロゴがそのままプリントされたような画像を生成できました。


複数の画像を入力して各要素を1枚の画像にまとめることもできます。


入力画像に含まれる「白いドレスを着た女性」「銀色のバイク」「銀色のパラシュート」などの要素がそのまま引き継がれました。


AIモデルの知識や推論を活用した生成も可能です。例えば、方程式を与えるだけで途中式と解答を推論し、その内容を画像に出力することが可能。


「アイスクリームのレシピを英語で書いて」と指示するだけで細かな手順を出力してくれます。


入力画像の大部分を維持したまま編集することもできます。以下の写真の手前に写る人物を消すように指示。


人物が写っていた部分だけがキレイに消えました。他の部分はそのまま維持されているのがポイントです。


文字の書き換えも可能。


白黒写真をカラー化することもできます。入力画像はこんな感じ。


着色結果は以下の通り。


画像全体の雰囲気を変化させることも可能。


アニメ風にしたり、アート風にしたりできます。


以下の図は「Seedream 4.0」「Gemini 2.5(Nano Banana)」「GPT Image 1」「Seedream 3.0」「Qwen-Image」の画像生成ベンチマーク結果を比較したものです。Seedream 4.0はすべてのテストでNano Bananaを上回り、一部のテストではGPT Image 1を超えるスコアを示しています。


画像編集性能の比較は以下の通り。Seedream 4.0は多くのテストで最高スコアを記録しました。


Seedream 4.0はfalComfyUIなどの複数のプラットフォームですでに利用可能となっています。また、ByteDanceによるプロンプトガイドが以下のリンク先で公開されています。

Seedream 4.0 User Guide - Feishu Docs
https://bytedance.larkoffice.com/docx/PBvldM6Xlo5OHKxsRNVcyAq4nFe

この記事のタイトルとURLをコピーする

・関連記事
Googleが無料の超高品質な画像編集AI「Gemini 2.5 Flash Image」をリリース、日本語で指示できて実写からアニメキャラへの変換も可能 - GIGAZINE

画像生成AI「Qwen-Image」登場、OpenAIやFlux超えの高品質画像を生成可能で「複数行の漢字」を自然に描写できる驚異的テキスト描画性能をアピール - GIGAZINE

高品質かつ高速な画像生成AI「FLUX.1 Kontext」が登場したので使ってみた、テキストと画像の入力に対応しアニメ風も実写風も生成可能 - GIGAZINE

Alibabaが画像生成AI「Qwen VLo」を発表、プログレッシブ生成手法を採用しテレビの走査線みたいに上から順に描画される - GIGAZINE

MetaがMidjourneyとパートナーシップを締結、画像・動画生成AIモデルを開発か - GIGAZINE

in AI,   ソフトウェア, Posted by log1o_hf

You can read the machine translated English article ByteDance releases image generation AI '….