Gemini 1.5 demostró una excelente capacidad de reconocimiento y comprensión en pruebas extremas, analizando con precisión las características de los videos generados por IA. Una ventana de contexto de 1 millón de tokens permitió un rendimiento excepcional del modelo en el procesamiento de videos largos, guiones de películas y otras tareas similares, mostrando una poderosa capacidad de generalización. Gemini 1.5 presenta mejoras significativas en las funciones de texto principales, siendo adecuado para una variedad de tareas de texto.
Gemini detecta videos generados por IA como Sora de un vistazo: capacidad de contexto de un millón de tokens supera a GPT-4

新智元
Este artículo proviene de AIbase Daily
¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.