Una startup de Singapur llamada Sapient Intelligence ha lanzado recientemente una arquitectura innovadora de inteligencia artificial llamada "Modelo de Razonamiento Jerárquico" (HRM). El modelo puede competir con los grandes modelos de lenguaje (LLMs) en tareas de razonamiento complejo, y en algunos casos incluso superarlos, mientras que requiere significativamente menos datos y tiene un tamaño de modelo más pequeño que los modelos tradicionales. El diseño de HRM se inspira en el cerebro humano, con el objetivo de lograr un razonamiento eficiente a través de diferentes sistemas de pensamiento.
Los LLM actuales suelen confiar en el método de cadena de pensamiento (CoT) para resolver problemas complejos, generando una serie de pasos de texto para el razonamiento. Aunque este enfoque ha mejorado en cierta medida la capacidad de razonamiento de los modelos, también tiene evidentes deficiencias. Los investigadores señalan que el método de cadena de pensamiento depende de pasos definidos manualmente, y una vez que ocurre un error, puede llevar al fracaso del proceso completo de razonamiento. Por lo tanto, el equipo de investigación de Sapient Intelligence ha propuesto un nuevo enfoque llamado "razonamiento latente", que permite al modelo razonar internamente en un espacio abstracto en lugar de depender únicamente de la generación de texto.
HRM consta de dos módulos interactivos: uno es un módulo de alto nivel encargado de la planificación lenta y abstracta, y otro es un módulo de bajo nivel que realiza cálculos rápidos y detallados. Este diseño jerárquico permite a HRM realizar un razonamiento profundo sin depender de grandes cantidades de datos de entrada. Los resultados de las pruebas muestran que HRM obtiene un excelente rendimiento al manejar tareas de alta dificultad como el razonamiento abstracto y el Sudoku complejo, demostrando sus fuertes capacidades en tareas complejas.
Además de la precisión, HRM también destaca en la velocidad de razonamiento. Según Wang Guan, fundador de Sapient Intelligence, HRM puede lograr una aceleración de 100 veces en el tiempo de finalización de tareas al realizar tareas específicas de razonamiento complejo. Esto significa que HRM puede realizar rápidamente cálculos poderosos de razonamiento en dispositivos de borde, reduciendo significativamente el tiempo y los costos empresariales.
A futuro, Sapient Intelligence está trabajando para desarrollar HRM como una solución más general de razonamiento, planeando aplicarla en múltiples campos como la salud, la predicción climática y la robótica. Este desarrollo marca que el éxito de la IA futura podría no residir simplemente en escalar el tamaño del modelo, sino en inspirarse en la estructura del cerebro humano para desarrollar arquitecturas de razonamiento más inteligentes y eficientes.
Puntos Clave:
🚀 HRM supera a los grandes modelos de lenguaje en tareas de razonamiento complejo con una nueva arquitectura jerárquica y requiere menos datos.
🔍 El modelo de HRM combina módulos de alto y bajo nivel, mejorando la velocidad y la eficiencia del razonamiento.
💼 La IA futura podría inspirarse más en el diseño del cerebro humano, en lugar de depender simplemente de escalar.