Anthropic lanzó de forma inesperada la versión Claude Sonnet 4.5 en la noche, esta actualización no solo logró una mejora significativa en los indicadores técnicos, sino que también mostró una nueva dirección innovadora para la generación en tiempo real de interfaces de software por parte de la IA a través de la función experimental "Imagine with Claude".
Claude Sonnet 4.5 obtuvo un avance notable en sus capacidades de programación. El modelo obtuvo un puntaje del 77,2% en el benchmark SWE-bench Verified, superando el 74,5% de su predecesor Claude Opus 4.1, y fue denominado por Anthropic como el mejor modelo de programación del mundo. En tareas de razonamiento lógico, matemáticas avanzadas y programación en pasos múltiples, mostró un excelente desempeño, siendo capaz de ejecutar tareas complejas durante más de 30 horas.
Destaca que, aunque el tamaño del modelo de Sonnet 4.5 es menor que el de Opus 4.1, en la mayoría de las dimensiones de capacidad ha logrado una ventaja. La estrategia de precios permanece sin cambios, con 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida. Se puede acceder a través de la API de Claude, Amazon Bedrock y Google Vertex AI.
En cuanto a la seguridad, la nueva versión optimizó el alineamiento del modelo, reduciendo patrones de comportamiento negativos como el halago al usuario o el engaño, y utilizó el marco de seguridad ASL-3 para filtrar contenido potencialmente peligroso. El modelo ya es capaz de reconstruir por sí mismo la aplicación web Claude.ai, completando más de 3000 llamadas a herramientas en 5,5 horas, demostrando una capacidad cercana a la de una aplicación de producción.
El punto destacado de este lanzamiento es la función experimental "Imagine with Claude", que ofrece una prueba de 5 días exclusivamente para usuarios con suscripción Max. Esta función temporal proporciona una interfaz de interacción similar a un entorno de escritorio, donde los usuarios ingresan sus necesidades mediante lenguaje natural y Claude Sonnet 4.5 genera en tiempo real elementos de la interfaz, lógica funcional y mecanismos de interacción.
A diferencia del desarrollo tradicional de software, la función Imagine no depende de código preestablecido ni de plantillas fijas, sino que genera aplicaciones completas dinámicamente según las intenciones del usuario. Por ejemplo, cuando un usuario solicita crear una aplicación de pronóstico del tiempo, la IA renderiza inmediatamente la interfaz, implementa la lógica funcional y la interacción de datos. Los usuarios también pueden colocar la aplicación generada en un entorno de escritorio para usarla.
Con el lanzamiento del modelo, Anthropic presentó el SDK Claude Agent, que permite a los desarrolladores construir agentes personalizados utilizando la infraestructura interna, soportando el acceso a máquinas virtuales, gestión de memoria y colaboración entre múltiples agentes. Claude Code añadió la función de puntos de control para retroceder rápidamente el progreso y se integró con entornos de desarrollo como VS Code y JetBrains, así como con una extensión de Chrome para usuarios Max.
La función Imagine with Claude ha generado amplios debates sobre sistemas operativos nativos de IA. Este método de generar interfaces en tiempo real desafía el paradigma tradicional de desarrollo de software, ya no dependiendo de código escrito previamente, sino permitiendo que la IA evolucione dinámicamente la interfaz y la lógica según las intenciones del usuario.
Es importante señalar que la función Imagine aún se encuentra en una etapa temprana de experimentación, existiendo problemas de latencia en la respuesta de botones de interfaces complejas, los cuales requieren una optimización adicional. Anthropic indica que este paso busca explorar los límites de las capacidades de los agentes, y en el futuro se expandirá a más escenarios de aplicación.
Desde la perspectiva de la tendencia tecnológica, Claude Sonnet 4.5 consolida la posición competitiva de Anthropic en el ámbito de la programación, mientras que la función Imagine representa una exploración de una nueva forma de interacción humano-máquina. Esta capacidad de generar interfaces de software en tiempo real podría provocar una transformación fundamental en el desarrollo de aplicaciones y el diseño de experiencias de usuario en el futuro.
No obstante, es necesario mantener una percepción racional: las funciones experimentales actuales están aún lejos de un sistema operativo verdaderamente nativo de IA. Muchos problemas como estabilidad, optimización del rendimiento y garantía de seguridad deben resolverse gradualmente en aplicaciones reales.