O Google lançou uma nova ferramenta de IA chamada Whisk, que revoluciona o modo tradicional de geração de imagens, permitindo que os usuários usem imagens como prompts, em vez de longas descrições de texto.
Com o Whisk, você pode enviar imagens para especificar o tema, o cenário e o estilo da imagem gerada pela IA, e pode usar várias imagens para cada um desses três elementos.
Por exemplo, eu inseri uma imagem de um porquinho e uma imagem de um gato, escolhi um estilo de ilustração e não inseri nenhum prompt de texto (claro, você também pode optar por usar prompts de texto simultaneamente). Ele automaticamente gerou esta imagem de resultado. Observe que a seção "CENÁRIO" geralmente recebe imagens de cenário, mas inserir imagens de personagens como eu fiz também funciona; ele mescla automaticamente a geração, às vezes a relação pode não ser grande, mas pode haver surpresas agradáveis.
Se você não tiver imagens adequadas à mão, pode clicar no ícone de dado para que o Google preencha automaticamente algumas imagens como prompts (essas imagens também parecem ser geradas por IA).
Cliquei aleatoriamente e o Google me deu um cachorro, um barco e uma imagem de bordado. Vamos ver que tipo de resultado isso produz:
O resultado ficou bom! Os elementos das três imagens se fundiram perfeitamente em um bordado interessante.
Ao clicar na imagem, descobri que o Whisk também fornece prompts de texto para cada imagem gerada. Se você estiver satisfeito com o resultado, pode salvar ou baixar a imagem; se quiser otimizar ainda mais, pode adicionar mais texto na caixa de texto ou clicar diretamente na imagem para editar o prompt de texto.
Em um post de blog, o Google destaca que o Whisk visa a "exploração visual rápida, não a edição precisa em nível de pixel". A empresa também afirma que o Whisk pode "errar o alvo", portanto, permite que os usuários editem os prompts subjacentes.
Experimentei a ferramenta Whisk por alguns minutos e achei muito interessante. Embora a geração de imagens leve alguns segundos, o que é um pouco irritante, e as imagens geradas às vezes sejam estranhas, o processo iterativo é divertido.
O Google afirma que o Whisk usa a versão mais recente do modelo de geração de imagens Imagen3, que também foi lançado hoje. O Google também lançou simultaneamente o modelo de geração de vídeo de nova geração Veo2, que, segundo a empresa, consegue entender a "linguagem única dos filmes" e tem "menos" alucinações, como dedos extras. O Veo2 será lançado primeiro no VideoFX do Google; os usuários podem se inscrever na lista de espera do Google Labs para experimentar e o plano é expandir para o YouTube Shorts e outros produtos no próximo ano.
Em resumo, o Whisk traz novas possibilidades para a geração de imagens, permitindo que os usuários expressem sua criatividade visualmente e personalizem imagens de forma mais conveniente.
Endereço para experimentar o produto: https://top.aibase.com/tool/whisk