Nos últimos dias, o ChatGPT atraiu muitos novos usuários graças à sua nova função de geração de imagens, com um aumento de 20 milhões de usuários pagos. Imagino que a OpenAI esteja muito feliz com isso.

Os diversos exemplos criativos que as pessoas têm compartilhado recentemente nos deixaram ainda mais impressionados com a capacidade de geração do ChatGPT4. Até mesmo problemas anteriores com a geração de texto em chinês foram resolvidos. Agora, o ChatGPT atualizou sua função "Criar imagem". Há poucos dias, ele só gerava fontes comuns, mas agora consegue gerar até mesmo caligrafia cursiva, com alta precisão.

image.png

Em comparação com a versão de alguns dias atrás, o novo modelo apresenta melhorias significativas na renderização de detalhes, na harmonia de cores e na compreensão de comandos complexos.

Por exemplo, após o usuário inserir um texto descritivo, o sistema consegue gerar imagens mais nítidas, naturais e que correspondem às expectativas, seja um retrato realista ou um estilo artístico abstrato, demonstrando maior nível de acabamento. Essa capacidade de iteração rápida demonstra a profunda experiência da OpenAI em otimização de algoritmos e treinamento de modelos, além de refletir sua resposta precisa às necessidades dos usuários.

Abaixo estão os resultados dos testes com prompts compartilhados pelo blogueiro hahagood do AIBASE:

image.png

Prompt: Crie um cartão no estilo infográfico desenhado à mão com proporção 9:16, com um título e texto em chinês em negrito usando caligrafia cursiva (草书). O fundo deve ser bege texturizado ou branco-queimado, com o título destacado em grandes caracteres em vermelho e preto em estilo pincelada. Use ilustrações ou ícones simples e atraentes desenhados à mão que complementem o tema. Para o conteúdo, organize-o em 2 a 4 seções, com frases curtas e concisas em chinês em caligrafia cursiva, cada uma ilustrando um ponto-chave. O texto deve ser legível, mas manter o fluxo e a natureza artística da escrita cursiva. Adicione elementos visuais relevantes (por exemplo, desenhos simples de pessoas, pontos de interrogação ou símbolos) para tornar o cartão visualmente envolvente e instigante. Certifique-se de que a composição geral seja equilibrada, com espaço suficiente para que o conteúdo pareça organizado e fácil de entender.

Impressionante! As pinceladas das letras estão completas e a fonte foi reproduzida corretamente.

No entanto, eu aumentei a dificuldade e testei com estilos de escrita em caracteres chineses tradicionais (隶书 - lishu) e selo (篆书 - zhuanshu). Também funcionou, mas com alguns erros. Os estilos de caligrafia mais comuns parecem não apresentar problemas, mas o estilo selo ainda é muito difícil para o ChatGPT.

image.png

隶书 (Lishu)

image.png

篆书 (Zhuanshu)

Vale ressaltar que a nova versão também introduziu uma ferramenta de seleção. Os usuários podem usar descrições de texto para ajustar áreas específicas da imagem, como modificar o tom de fundo ou adicionar elementos de detalhe. Essa capacidade de edição refinada oferece maior flexibilidade aos criadores.