Hace poco, Google realizó una importante actualización en su serie de modelos de lenguaje a gran escala (LLM) Gemini, especialmente en Gemini 2.5 Flash y Flash Lite, destacando la mejora en velocidad y eficiencia. Estos mejoramientos se realizan continuamente entre las grandes versiones, demostrando claramente el compromiso de Google con la continua evolución en el campo de la inteligencia artificial.

image.png

Según la evaluación de la institución de análisis independiente Artificial Analysis, Gemini 2.5 Flash Lite se ha convertido en "el modelo privado más rápido" de su sitio web, con una velocidad de salida de 887 tokens por segundo, lo que representa un aumento del 40% respecto a la versión anterior. Aunque aún hay una brecha frente al nuevo modelo de código abierto K2Think lanzado por MBZUAI y G42AI (que genera 2.000 tokens por segundo), la velocidad de Gemini 2.5 Flash Lite sigue siendo notable.

image.png

Estos dos nuevos modelos han mostrado mejoras significativas en la calidad de salida y la eficiencia de costos, especialmente en el uso de tokens y la velocidad de respuesta. Gemini 2.5 Flash destaca en la capacidad para manejar flujos de trabajo multi-etapa y autónomos, logrando un aumento en su puntuación en la prueba de referencia SWE-Bench Verified hasta un 54%. Mientras tanto, Flash Lite también ha mejorado en la comprensión de instrucciones y en sus capacidades multimodales, reduciendo la cantidad de tokens de salida en un 50%, lo que disminuye los costos de implementación en aplicaciones de alta volumetría.

En pruebas independientes, el rendimiento de Gemini 2.5 Flash y Flash Lite ha sido confirmado adicionalmente, con mejoras notables en varios tests. Para facilitar el uso por parte de desarrolladores, Google también ha introducido nuevos nombres alternativos, permitiendo integrar fácilmente la última versión del modelo.

Aparte de la actualización de los LLM, Google también ha mejorado Gemini Live, un modelo de audio en tiempo real diseñado específicamente para aplicaciones de voz. La nueva versión ha mejorado la confiabilidad en las llamadas a funciones y la capacidad de procesamiento de conversaciones naturales. Los desarrolladores podrán crear asistentes de voz más responsivos, capaces de interactuar mejor con los usuarios en entornos dinámicos. Los usuarios pueden utilizar directamente el nuevo modelo actualizado de Gemini Live mediante una versión previa.

Esta actualización de Google no solo ha mejorado el rendimiento y la utilidad de los modelos, sino que también ha proporcionado a los desarrolladores mayor flexibilidad. En el futuro, Google planea lanzar más actualizaciones en la serie Gemini para satisfacer las crecientes necesidades de los desarrolladores.

Puntos clave:

🌟 Gemini 2.5 Flash Lite se ha convertido en el modelo privado más rápido, con una velocidad de salida de 887 tokens por segundo.

🚀 Los nuevos modelos han mejorado significativamente la calidad de salida y la eficiencia de costos, especialmente Flash Lite, que reduce en un 50% los tokens de salida.

🗣️ La actualización de Gemini Live ha mejorado las funciones de los asistentes de voz, aumentando la precisión de las llamadas a funciones y la capacidad de conversaciones naturales.