Em um recente avanço tecnológico, pesquisadores desenvolveram uma ferramenta de edição de imagens chamada UltraEdit, que alcança um novo nível de processamento de imagens combinando feedback linguístico e visual. Em resumo, o UltraEdit possui um conjunto de dados de treinamento superior e suporta tanto a redesenho local quanto a edição global.

image.png

Edição de imagens em formato livre e baseada em região

Acesso ao produto: https://top.aibase.com/tool/ultraedit

O UltraEdit apresenta várias vantagens significativas:

  • Ele utiliza a criatividade de modelos de linguagem grandes (LLMs) e exemplos de edição contextual de avaliadores humanos, fornecendo instruções de edição mais abrangentes;

  • Sua fonte de dados é baseada em imagens reais, incluindo fotos e obras de arte, oferecendo maior diversidade e menos viés em comparação com conjuntos de dados gerados apenas por modelos de texto para imagem;

  • Ao contrário dos métodos de edição tradicionais, o UltraEdit oferece modos de edição em formato livre e baseada em região, permitindo que os usuários façam redesenhos locais e edições globais com mais flexibilidade para atender às diferentes necessidades.

A ferramenta UltraEdit traz novas esperanças e possibilidades para o campo do processamento de imagens. Ao comparar diferentes conjuntos de dados de edição de imagens, o UltraEdit demonstra suas vantagens em tarefas de edição ricas e com menos viés, oferecendo aos usuários mais opções de amostra e uma experiência de edição de maior qualidade.

Abaixo estão exemplos de edições geradas pelo Stable Diffusion 3 treinado com o conjunto de dados UltraEdit. Ele suporta edição de imagens em formato livre (sem máscara) e baseada em região (com máscara):

image.png

image.png

image.png

Destaques:

🌟 Combinando feedback linguístico e visual, o UltraEdit cria uma nova maneira de processar imagens

🌟 Oferece modos de edição em formato livre e baseada em região para atender às diferentes necessidades

🌟 Apresenta vantagens significativas em tarefas de edição ricas e com menos viés, proporcionando aos usuários uma experiência de edição de alta qualidade