Google ha lanzado una nueva herramienta de IA llamada Whisk, que revoluciona la forma tradicional de generar imágenes. Permite a los usuarios utilizar imágenes como indicaciones, en lugar de largas descripciones de texto.

Con Whisk, puedes subir imágenes para especificar el tema, la escena y el estilo de la imagen generada por la IA, y puedes usar varias imágenes para cada uno de estos tres aspectos.

image.png

Por ejemplo, subí una imagen de un cerdo y una de un gato, seleccioné un estilo de ilustración, y no ingresé ninguna otra indicación de texto (aunque también puedes usar indicaciones de texto). Automáticamente, generó esta imagen. Ten en cuenta que la sección "ESCENA" generalmente se utiliza para imágenes de escenas, aunque, como yo, puedes usar imágenes de personajes; la herramienta las fusionará automáticamente. A veces la relación puede no ser obvia, pero puede haber sorpresas agradables.

Si no tienes imágenes adecuadas a mano, puedes hacer clic en el icono del dado para que Google rellene automáticamente algunas imágenes como sugerencias (estas imágenes también parecen ser generadas por IA).

image.png

Hice clic al azar, y Google me dio un perro, un barco y una imagen de bordado. Veamos qué resultado obtenemos:

image.png

¡El resultado es bastante bueno! Los elementos de las tres imágenes se fusionan perfectamente en una divertida imagen de bordado.

image.png

Al hacer clic en la imagen, descubrí que Whisk también proporciona indicaciones de texto para cada imagen generada. Si estás satisfecho con el resultado, puedes guardar o descargar la imagen; si deseas optimizarla aún más, puedes agregar más texto en el cuadro de texto o hacer clic directamente en la imagen para editar las indicaciones de texto.

En una entrada de blog, Google destaca que Whisk está diseñado para la "exploración visual rápida, no para la edición precisa a nivel de píxeles". La compañía también indica que Whisk puede "desviarse", por lo que permite a los usuarios editar las indicaciones subyacentes.

Probé la herramienta Whisk durante unos minutos y la encontré muy interesante. Aunque la generación de imágenes tarda unos segundos, lo cual es un poco molesto, y las imágenes generadas a veces son un poco extrañas, el proceso iterativo es muy divertido.

Google afirma que Whisk utiliza la última versión del modelo de generación de imágenes Imagen3, que también se lanzó hoy. Google también lanzó simultáneamente el modelo de generación de video de nueva generación Veo2, que según se dice, comprende el "lenguaje único del cine" y tiene "menos" alucinaciones, como dedos adicionales. Veo2 se lanzará primero en VideoFX de Google. Los usuarios pueden solicitar acceso a través de la lista de espera de Google Labs, y se planea su expansión a YouTube Shorts y otros productos para el próximo año.

En resumen, la aparición de Whisk ofrece nuevas posibilidades para la generación de imágenes, permitiendo a los usuarios expresar su creatividad visualmente y personalizar las imágenes de forma más sencilla.

Enlace para probar el producto: https://top.aibase.com/tool/whisk