Liquid AI lanzó recientemente su nuevo modelo "Hyena Edge" antes de la Conferencia Internacional sobre Representaciones de Aprendizaje (ICLR) 2025. Se trata de un modelo multihíbrido basado en convoluciones, diseñado para ofrecer soluciones de inteligencia artificial más eficientes para teléfonos inteligentes y otros dispositivos de borde.
Hyena Edge destaca por su eficiencia computacional y la calidad de su modelo de lenguaje. Según los datos obtenidos en pruebas, en un teléfono Samsung Galaxy S24 Ultra, Hyena Edge presenta una latencia menor, un menor consumo de memoria y un rendimiento superior en varias pruebas de referencia en comparación con el modelo Transformer++ con los mismos parámetros. Este nuevo diseño de arquitectura marca una nueva era en la tecnología de inteligencia artificial de borde.
A diferencia de la mayoría de los modelos pequeños diseñados para implementaciones móviles, Hyena Edge abandona el tradicional diseño de atención pesada y utiliza en su lugar las convoluciones controladas de la serie Hyena-Y, reemplazando dos tercios de las operaciones de atención de consulta agrupada (GQA). La arquitectura de Hyena Edge se basa en el marco "Síntesis de Arquitectura Personalizada" (STAR) de Liquid AI, que utiliza algoritmos evolutivos para diseñar automáticamente la estructura del modelo con el fin de optimizar varios objetivos específicos del hardware, como la latencia, el uso de memoria y la calidad del modelo.
Para verificar la capacidad de aplicación práctica de Hyena Edge, Liquid AI realizó pruebas en un Samsung Galaxy S24 Ultra. Los resultados mostraron que la velocidad de prellenado y decodificación del modelo con secuencias largas era un 30% más rápida que la de Transformer++. Además, el consumo de memoria de Hyena Edge fue inferior al de los modelos tradicionales en todas las longitudes de secuencia probadas, lo que lo convierte en una opción ideal para entornos con recursos limitados.
En cuanto a las pruebas de referencia, Hyena Edge fue entrenado con 100 mil millones de tokens y obtuvo excelentes resultados en varias pruebas estándar de modelos de lenguaje pequeños, incluyendo Wikitext, Lambada, PiQA, HellaSwag, Winogrande, ARC-easy y ARC-challenge. Destaca especialmente la mejora significativa en la puntuación de perplejidad en Wikitext y Lambada, así como la mayor precisión en PiQA, HellaSwag y Winogrande.
Liquid AI también planea lanzar una serie de modelos base Liquid de código abierto en los próximos meses, incluyendo Hyena Edge, con el objetivo de construir un sistema de inteligencia artificial general eficiente que pueda escalar desde centros de datos en la nube hasta dispositivos de borde personales. El éxito de Hyena Edge no solo radica en sus excelentes indicadores de rendimiento, sino que también demuestra el potencial del diseño automático de arquitecturas, estableciendo un nuevo estándar para la inteligencia artificial optimizada para dispositivos de borde en el futuro.
Blog oficial: https://www.liquid.ai/research/convolutional-multi-hybrids-for-edge-devices
Puntos clave:
🌟 Hyena Edge es un nuevo modelo convolucional de Liquid AI, diseñado específicamente para dispositivos de borde como teléfonos inteligentes.
🚀 Este modelo supera a los modelos tradicionales Transformer++ en eficiencia computacional y uso de memoria, lo que lo hace ideal para entornos con recursos limitados.
📈 Hyena Edge ha demostrado un rendimiento excepcional en varias pruebas de referencia de modelos de lenguaje estándar y se planea su lanzamiento de código abierto para promover la difusión de la tecnología.