Das ByteDance Doubao-Team für große Sprachmodelle hat kürzlich SeedEdit vorgestellt, das erste in China produktreife, universelle Bildbearbeitungsmodell. Die Technologie wird bereits auf der Doubao-PC-Version und der Jimeng-Webseite getestet. Diese bahnbrechende Technologie ermöglicht es Nutzern, mit einfachen Textanweisungen professionelle Bildbearbeitungsergebnisse zu erzielen.

image.png

Als revolutionäres Bildbearbeitungswerkzeug durchbricht SeedEdit die technischen Grenzen traditioneller Bildbearbeitung. Benutzer können mit natürlichsprachlichen Anweisungen mühelos Bildretuschen, Outfit-Wechsel, Verschönerungen, Stilumwandlungen und das Hinzufügen oder Entfernen von Elementen in bestimmten Bereichen durchführen. Beispielsweise kann ein Benutzer, nachdem er ein Bild von „einem Hund, der auf einer Wiese rennt“ erstellt hat, einfach die Anweisung „Hintergrund auf Strand ändern“ eingeben, um einen perfekten Szenenwechsel zu erhalten.

Das ByteDance-Team hat bei der Modellentwicklung innovativ das Problem der Datenknappheit gelöst. Durch ein Datenerstellungsschema mit mehreren Modellen, mehreren Maßstäben und mehreren Standards wurden Datenmenge, -vielfalt und -qualität deutlich verbessert. Im Vergleich zu bestehenden Technologien der Branche bietet SeedEdit Durchbrüche in Bezug auf Universalität, Steuerbarkeit und Ausgabequalität. Besonders bei traditionellen Aufgaben wie der Bildsegmentierung erzeugt SeedEdit natürlichere Bilder ohne den typischen „Aufkleber-Effekt“.

image.png

In Leistungstests schnitt SeedEdit in Benchmarks wie HQ-Edit hervorragend ab. Es versteht nicht nur vage Anweisungen, sondern weist auch bei der Durchführung präziser Bearbeitungen eine höhere Bildhalte- und Erfolgsrate auf. Derzeit unterstützt das Modell die Eingabe in Chinesisch und Englisch und erkennt chinesische Idiome und Eigennamen präzise.

Das Doubao-Team gibt an, dass SeedEdit zwar derzeit bei der Bearbeitung von modellgenerierten Bildern besser abschneidet als bei realen Bildern, aber die Modellleistung kontinuierlich optimiert wird. Künftig wird sich das Team auf die Verbesserung der Bearbeitung von realen Bildern, die ID-Erhaltung und die Bearbeitungsgenauigkeit konzentrieren und die Generierung von langzeitlichen Story- und Comic-Inhalten erforschen, um den Nutzern leistungsstärkere Kreativwerkzeuge zu bieten.

Testversion: https://top.aibase.com/tool/seededit