Google lanzó oficialmente el 22 de enero de 2025 una versión mejorada de su modelo de razonamiento Gemini 2.0 Flash Thinking, recuperando el primer puesto en Chatbot Arena. Esta actualización se centra principalmente en la capacidad de procesamiento de contextos largos, con soporte para entradas de hasta 1 millón de tokens, ofreciendo a los usuarios un análisis más profundo al trabajar con textos extensos.
Jeff Dean, responsable de IA de Google, declaró en la presentación que esta actualización experimental tiene como objetivo mejorar la fiabilidad del modelo y reducir las contradicciones entre el proceso de pensamiento y la respuesta final. Gemini 2.0 Flash Thinking no solo mantiene las ventajas de la versión anterior, sino que también añade una función de razonamiento mejorado basada en el pensamiento ("thoughts"), mostrando un rendimiento excepcional.
A nivel técnico, Gemini 2.0 Flash Thinking ha logrado dos grandes avances: en primer lugar, la capacidad de procesar contextos largos de hasta 1 millón de tokens, crucial para conversaciones y procesos de razonamiento complejos y multiturno; en segundo lugar, una mejora significativa en la autocorrección, manteniendo la coherencia en la conversación y aplicando flexiblemente la información acumulada previamente. Esto significa que los usuarios pueden experimentar una interacción más natural y consistente con el modelo.
En una demostración, Jeff Dean mostró cómo el modelo resolvía problemas de física y explicaba el proceso de razonamiento, dejando una impresión profunda. Además, los participantes destacaron que la experiencia real con el nuevo modelo era incluso más rápida que en la demostración.
Además de la capacidad de procesamiento de contextos largos, Gemini 2.0 Flash Thinking también ha mejorado significativamente en pruebas de matemáticas, ciencias y razonamiento multimodal, con un aumento del 54% en matemáticas. Estos excelentes resultados generan grandes expectativas sobre el futuro del modelo.
En la interfaz de usuario, la plataforma "Google AI Studio" ofrece acceso completo a las funciones del modelo, incluyendo la creación de prompts, conversaciones en tiempo real y el desarrollo de aplicaciones. Aunque actualmente las funciones de la interfaz están algo dispersas, Google planea proporcionar un informe técnico más detallado y una guía de usuario tras el lanzamiento oficial del modelo para mejorar la experiencia del usuario.
De cara al futuro, el equipo de desarrollo de Google está explorando activamente la capacidad de procesamiento de datos 3D, mostrando su firme compromiso con la innovación continua. Es previsible que el próximo gran avance de Google en el campo de la IA esté a la vuelta de la esquina, y merece la pena seguirlo de cerca.
Enlace de prueba: https://aistudio.google.com/prompts/new_chat