En el campo de la generación de imágenes con IA, el método tradicional de indicaciones de texto ya es bastante común. Sin embargo, Whisk, lanzado por Google, presenta un enfoque completamente nuevo que prioriza lo visual. Permite a los usuarios emplear imágenes como entrada para generar y remezclar creatividades, ofreciendo a los creadores una experiencia de generación de imágenes más intuitiva y creativa.

Hero_hmKlSP6.width-1600.format-webp.png

Introducción a Whisk

Whisk es una innovadora herramienta de IA generativa lanzada por Google Labs. Utilizando los modelos Gemini e Imagen 3, genera nuevas imágenes a partir de imágenes de entrada proporcionadas por el usuario que representan el sujeto, la escena y el estilo. La herramienta está principalmente orientada a la exploración creativa, diseñada para ayudar a los usuarios a generar e iterar rápidamente diversas ideas creativas, en lugar de utilizarse para la edición precisa de imágenes. Actualmente, Whisk solo está disponible para usuarios en Estados Unidos (IP estadounidense) y se puede acceder a él y proporcionar comentarios en labs.google/whisk.

截屏2024-12-17 下午3.45.28.jpg

Características destacadas de Whisk

  • Generación impulsada por imágenes: Los usuarios pueden cargar imágenes para determinar el sujeto, la escena y el estilo, en lugar de utilizar indicaciones de texto. Esto proporciona una forma más conveniente para aquellos que no están familiarizados con la redacción de indicaciones de texto. Por ejemplo, un usuario puede cargar una imagen de un gato como sujeto, una imagen de una hoja de nenúfar como escena y una imagen con elementos brillantes como estilo para generar una imagen única.
  • Subtítulos detallados generados automáticamente: El modelo Gemini escribe automáticamente descripciones detalladas de los subtítulos de las imágenes cargadas por el usuario. Estas descripciones se introducen en el modelo Imagen 3 para capturar mejor las características clave de la imagen y generar una nueva imagen que se ajuste a la intención del usuario.
  • Remix creativo: Permite remezclar diferentes imágenes de sujetos, escenas y estilos para crear diseños únicos, como muñecas digitales, broches de esmalte y otros productos creativos.
  • Captura de la esencia, no copia: Captura las características esenciales de las imágenes de entrada, en lugar de copiarlas con precisión. Esto permite una mayor variación creativa en las imágenes generadas, pero también puede provocar que los resultados no coincidan exactamente con las expectativas del usuario.
  • Indicaciones editables: Los usuarios pueden ver y editar la información de las indicaciones subyacentes para ajustar y optimizar las imágenes generadas según sus necesidades, como modificar el color, los patrones, etc.

截屏2024-12-17 下午3.50.10.jpg

Escenarios de aplicación

  1. Diseño creativo: Los diseñadores pueden usar Whisk para explorar rápidamente diferentes direcciones de diseño, generando inspiración creativa mediante la carga de diversas imágenes relacionadas, como diseñar una apariencia única para un nuevo producto.
  2. Creación artística: Los artistas pueden utilizar Whisk para la concepción previa de obras de arte, fusionando y experimentando con diferentes elementos mediante la entrada de imágenes, como crear una pintura de temática fantástica, utilizando imágenes relacionadas de criaturas fantásticas, escenarios, etc., para obtener ideas creativas.
  3. Personalización de productos: Para la industria de personalización de productos, como la creación de insignias, pegatinas, etc., Whisk puede ayudar a los usuarios a generar rápidamente diversas opciones de diseño. Los usuarios solo necesitan cargar imágenes que representen sus preferencias de sujeto, escena y estilo para obtener un diseño personalizado único.
  4. Marketing y publicidad: Los planificadores de publicidad pueden usar Whisk para generar materiales publicitarios creativos. Mediante la carga de imágenes de sujetos relacionados con el producto y escenas y estilos que se ajusten a la imagen de marca, se pueden obtener rápidamente imágenes publicitarias atractivas para la publicidad online y offline.
  5. Educación: En el ámbito educativo, los profesores pueden utilizar Whisk para apoyar la enseñanza. Por ejemplo, en clase de arte, los alumnos pueden cargar imágenes de objetos que les interesen para estimular su creatividad y desarrollar su imaginación.

截屏2024-12-17 下午3.48.01.jpg

Tutorial de uso de Whisk

  1. Acceso a la herramienta: Los usuarios con IP estadounidense pueden acceder a la página de la herramienta Whisk en labs.google/whisk.
  2. Cargar imágenes: Cargar imágenes que representen el sujeto, la escena y el estilo según el contenido de la imagen que se desea generar. Si no hay imágenes adecuadas, también se puede hacer clic en el icono del dado para obtener algunas imágenes sugeridas (estas imágenes también pueden ser generadas por IA).
  3. Generar imágenes: Después de cargar las imágenes, Whisk generará automáticamente nuevas imágenes y las indicaciones de texto correspondientes.
  4. Ver y ajustar: Ver las imágenes generadas. Si no está satisfecho, puede ajustar y optimizar la imagen editando la información de las indicaciones en el cuadro de texto o haciendo clic en la imagen y editando las indicaciones de texto relacionadas.
  5. Descargar o guardar: Si está satisfecho con las imágenes generadas, puede descargarlas y guardarlas, o añadirlas a sus favoritos para su uso posterior.

截屏2024-12-17 下午3.46.32.jpg

Conclusión

Whisk, como herramienta innovadora de generación de imágenes con IA, ofrece a los usuarios una experiencia creativa completamente nueva gracias a su singular método de entrada de imágenes y su función de remezcla creativa. Tiene un potencial de aplicación en diversos campos, como el diseño creativo, la creación artística y la personalización de productos. Aunque actualmente solo está disponible para usuarios estadounidenses y puede que los resultados de la generación no sean perfectos en todos los casos, la dirección que representa, la generación de imágenes con IA que prioriza lo visual, merece nuestra atención.

Si te interesa la creatividad y la generación de imágenes con IA, dale a "me gusta", comenta y sigue de cerca el desarrollo de Whisk. Esperamos que en el futuro nos ofrezca más sorpresas y posibilidades.