バイトダンスのDoubao大規模言語モデルチームは先日、国内で初めて製品化された汎用画像編集モデルSeedEditを発表しました。この技術は、Doubao PC版と即夢ウェブ版でテストが開始されています。この画期的な技術により、ユーザーは簡単なテキスト指示だけで、プロレベルの画像編集効果を実現できます。
画期的な画像編集ツールであるSeedEditは、従来の画像編集技術の壁を打ち破りました。ユーザーは自然言語による指示で、画像の修正、衣装変更、美化、スタイル変換、特定領域への要素の追加や削除などの複雑な操作を簡単に実行できます。「子犬が草原を走っている」画像を作成した後、「背景を海辺に変える」という簡単な指示を入力するだけで、完璧なシーン変換効果を得ることができます。
バイトダンスチームは、モデル開発において、データ不足の問題を革新的に解決しました。マルチモデル、マルチスケール、マルチスタンダードのデータ作成手法により、データ量、多様性、品質を大幅に向上させました。業界既存技術と比較して、SeedEditは汎用性、制御性、出力品質において飛躍的な進歩を遂げています。特に画像セグメンテーションなどの従来のタスクでは、SeedEditで生成された画像はより自然で、「貼り付け感」がありません。
性能テストでは、SeedEditはHQ-Editなどのベンチマーク評価で優れた結果を示し、曖昧な指示も理解し、精密な編集の実行においても高い画像保持率と成功率を達成しました。現在、このモデルは中国語と英語の入力をサポートしており、中国語の成句や固有名詞も正確に認識できます。
Doubaoチームは、現在のSeedEditはモデル生成画像の処理効果が実画像よりも優れているものの、モデル性能の継続的な最適化に取り組んでいると述べています。今後は、実画像処理効果、ID保持能力、編集精度の向上に重点を置き、長時系列のストーリー系、漫画系コンテンツの生成にも取り組んでいくことで、ユーザーにより強力な創作ツールを提供していきます。