A OpenAI está ativamente testando um novo recurso para adicionar marcas d'água ao seu modelo de geração de imagens GPT-4o. Recentemente, o ChatGPT chamou a atenção por sua poderosa capacidade de geração de imagens, sendo capaz não apenas de gerar imagens com texto com precisão, mas também de criar obras visuais altamente realistas, até mesmo imitando os estilos artísticos de empresas famosas de animação, como o Studio Ghibli.

ChatGPT

Nota da imagem: Imagem gerada por IA, fornecida pela Midjourney

Relatos indicam que o modelo ImageGen, inicialmente disponível apenas para usuários do ChatGPT Plus, agora está totalmente aberto a todos os usuários. O pesquisador de IA Tibor Blaho descobriu recentemente que a OpenAI parece estar testando uma marca d'água chamada "ImageGen" em imagens geradas por usuários gratuitos. Fontes também confirmaram que a OpenAI começou recentemente a adicionar marcas d'água às imagens geradas em contas gratuitas, enquanto os usuários com assinatura do ChatGPT Plus podem salvar imagens sem marcas d'água.

A OpenAI anteriormente enfatizou em seu blog que os dados de treinamento do modelo GPT-4o incluem uma grande quantidade de imagens e texto, o que lhe confere não apenas um excelente efeito estético, mas também uma ampla utilidade. A OpenAI apontou que, através do treinamento conjunto de uma grande quantidade de imagens e texto online, o modelo aprendeu não apenas a relação entre imagens e linguagem, mas também as relações lógicas entre as imagens. Combinado com um poderoso treinamento posterior, o modelo apresenta uma impressionante capacidade de expressão visual, gerando imagens não apenas práticas e coerentes, mas também com uma boa compreensão do contexto.

Além disso, a OpenAI confirmou que está desenvolvendo a API ImageGen, e no futuro os desenvolvedores poderão usar essa interface para construir seus próprios aplicativos. A medida de adicionar marcas d'água para usuários gratuitos pode ser um passo importante da OpenAI para regular melhor o uso e diferenciar os direitos dos usuários na área de geração de imagens, e também prenuncia o aprofundamento de sua estratégia de comercialização.