Google Labs lanzó recientemente en Estados Unidos su nueva herramienta experimental de inteligencia artificial generativa, Whisk. A diferencia de las herramientas tradicionales de generación de imágenes que dependen principalmente de indicaciones de texto, Whisk se centra en el uso de imágenes como método de entrada, permitiendo a los usuarios crear obras de arte de forma más intuitiva.

Los usuarios pueden cargar imágenes directamente a Whisk o generar imágenes dentro de la herramienta, especificando elementos como el tema, la escena y el estilo. El sistema Whisk permite a los usuarios mezclar y combinar estos componentes, y también pueden usar indicaciones de texto adicionales para realizar ajustes según sea necesario.

image.png

Cabe destacar que, en segundo plano, el modelo de lenguaje de Google (posiblemente el Gemini 2.0 Flash recientemente lanzado) genera automáticamente una descripción detallada de la imagen de entrada. Estas descripciones se introducen en el modelo de generación de imágenes más reciente de Google, Imagen 3, para capturar las características esenciales del sujeto, en lugar de crear una copia idéntica.

AIbase realizó varias pruebas; al cargar las tres imágenes de la izquierda, se pudo generar la imagen combinada de la derecha. Los resultados fueron bastante buenos y la herramienta ofrece una alta capacidad de juego. A continuación se muestran los ejemplos:

8a92dca39c0f78a14c7a360b3fe86803.png

2a4e7ad2d1618ebedcb8151bb9b8b117.png

Sin embargo, dado que Whisk solo extrae unos pocos elementos clave de cada imagen de origen, Google advierte a los usuarios que el resultado de la imagen generada puede diferir de lo esperado. Por ejemplo, la imagen generada puede tener diferencias en altura, peso, peinado o tono de piel en comparación con la imagen original.

Ante esto, Google afirma que estos detalles suelen ser cruciales para el éxito del proyecto, por lo que permite a los usuarios ver y editar las indicaciones de texto que impulsan el proceso de generación de imágenes.

Los probadores iniciales, incluidos algunos artistas y profesionales creativos, afirman que Whisk se asemeja más a una nueva herramienta creativa que a un editor de imágenes tradicional. Google espera que esta herramienta ayude a los usuarios a realizar lluvias de ideas visuales rápidas, en lugar de ediciones precisas, permitiendo que los usuarios generen y filtren rápidamente varias opciones antes de guardar sus obras favoritas.

Tras las pruebas iniciales, aunque Whisk es muy agradable de usar, la generación de cada imagen nueva requiere una espera de unos segundos. Estos retrasos podrían deberse al alto tráfico, ya que muchos usuarios se han apresurado a probar esta nueva herramienta.

Actualmente, Whisk solo está disponible para usuarios de Estados Unidos. Los usuarios pueden probarlo gratuitamente y compartir sus comentarios en labs.google/whisk. Por el momento, los usuarios de otros países no pueden acceder a esta herramienta.

Whisk pertenece a Google Labs, el campo de pruebas de Google para sus proyectos de IA, incluyendo Gemini, Imagen y el último modelo de video Veo2. Si bien la mayoría de los proyectos aún se encuentran en fase experimental, algunos proyectos exitosos, como el asistente de IA NotebookLM lanzado recientemente, se transforman en productos completos.

Dirección para probar el producto: https://top.aibase.com/tool/whisk

Puntos clave:

🌟 Google lanza Whisk, la primera herramienta de IA generativa basada principalmente en imágenes.

🎨 Los usuarios pueden cargar o generar imágenes para realizar diseños visuales rápidos en lugar de ediciones precisas.

🚫 Actualmente, solo disponible para usuarios de Estados Unidos. El acceso está restringido para otros países.