A Black Forest Labs anunciou oficialmente que seu novo modelo de edição de imagem FLUX.1Kontext [dev] está agora aberto ao público, gerando grande atenção da comunidade de IA.

Esse modelo é o mais recente membro da série FLUX.1, sendo elogiado como uma alternativa de código aberto competitiva com o GPT-4o, graças às suas fortes capacidades de edição de imagens e desempenho eficiente. O FLUX.1Kontext [dev] se baseia em uma arquitetura de transformador de correspondência de fluxo com 1,2 bilhão de parâmetros, projetada especificamente para tarefas de edição de imagens, suportando execução em hardware de uso geral, oferecendo flexibilidade inigualável para criadores, desenvolvedores e pesquisadores.

image.png

Funcionalidades principais: Percepção de contexto e edição precisa

O principal destaque do FLUX.1Kontext [dev] é sua capacidade de geração e edição de imagens com percepção de contexto. Diferentemente dos modelos tradicionais de geração de imagens baseados apenas em dicas de texto, esse modelo é capaz de entender tanto entradas de texto quanto de imagem, permitindo a geração e edição verdadeiramente contextuais.

Os usuários podem modificar imagens existentes com instruções de texto simples, por exemplo, alterar a cor, estilo ou fundo de áreas específicas, mantendo a consistência no estilo de personagens ou objetos. Além disso, o modelo suporta edição iterativa múltipla, reduzindo ao máximo o desvio visual e garantindo qualidade e consistência das imagens.

Open source impulsionando inovação na comunidade

Como modelo de código aberto, o FLUX.1Kontext [dev] utiliza uma licença não comercial e é compatível com o código de inferência anterior do FLUX.1[dev], permitindo que pesquisadores e artistas utilizem livremente o modelo em cenários pessoais, científicos e específicos comerciais.

A Black Forest Labs afirmou que o modelo foi treinado com tecnologia de distilização direcionada, melhorando significativamente a eficiência e oferecendo possibilidades de desenvolvimento personalizado. O AIbase observou que o modelo já está disponível em vários plataformas, incluindo Replicate, Hugging Face, etc., e os desenvolvedores da comunidade já estão explorando suas aplicações inovadoras nas áreas de criação artística e geração de conteúdo.

Desenvolvimento responsável de IA

A Black Forest Labs enfatizou o desenvolvimento responsável da tecnologia de IA generativa. Antes do lançamento do FLUX.1Kontext, a equipe reduziu o risco de geração de conteúdo inseguro através de filtragem de dados e parcerias com a Internet Watch Foundation.

O conteúdo gerado pelo modelo também adota o padrão C2PA para adicionar metadados de assinatura criptografada, garantindo a rastreabilidade do conteúdo. Além disso, a Black Forest Labs monitorará o uso por meio de APIs para prevenir comportamentos que violem as políticas, demonstrando seus esforços para equilibrar inovação tecnológica e ética.

Efeito na indústria e visão futura

O lançamento aberto do FLUX.1Kontext [dev] marca outro marco na área de edição de imagens. O AIbase acredita que sua eficiente capacidade de edição iterativa e adaptação ao hardware de uso geral reduzirá significativamente a barreira para a edição profissional de imagens, ajudando mais criadores a concretizar suas ideias. Em comparação com a funcionalidade de edição de imagens do GPT-4o da OpenAI, o FLUX.1Kontext [dev] tem vantagens em velocidade e custo, o que deve impulsionar a competição entre a comunidade de código aberto e os modelos fechados.

No futuro, a Black Forest Labs planeja aprimorar ainda mais o modelo e explorar aplicações expandidas de texto para vídeo, trazendo nova vitalidade para a IA generativa.

Endereço do código aberto: https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev

Github: https://github.com/black-forest-labs/flux