Anthropic ha lanzado recientemente el modelo Claude Sonnet 4.5, este modelo de inteligencia artificial muy esperado se presentó oficialmente el 29 de septiembre y es conocido como "el mejor modelo de codificación del mundo", marcando un gran avance en la capacidad de la IA para manejar tareas complejas y agentes autónomos. A continuación, se presenta un análisis profesional basado en los últimos datos.

image.png

Lanzamiento del modelo y principales características

Anthropic anunció que Claude Sonnet 4.5 ya está disponible en todo el mundo, compatible con el sitio web Claude.ai, las aplicaciones para iOS y Android, así como con interfaces de API.

Este modelo obtuvo un desempeño destacado en la prueba de referencia de codificación SWE-bench Verified, logrando mantener un trabajo autónomo por más de 30 horas, mucho más que los 7 horas límite del modelo anterior, Claude Opus 4. Esto significa que la IA ya no está limitada a la generación de prototipos simples, sino que puede manejar tareas complejas y de múltiples pasos que abarcan varias bibliotecas de código, permitiendo el desarrollo de aplicaciones listas para producción.

En cuanto al desempeño real, la precisión de edición de código de Claude Sonnet 4.5 mejoró de un 9% de error en el modelo anterior a un 0%, con una mayor tasa de éxito en el uso de herramientas, además de un menor costo. En la prueba OSWorld (que evalúa tareas reales en computadoras), obtuvo una puntuación de 61,4%, lo que representa un aumento del 19,2% frente al Sonnet 4 de hace cuatro meses. Además, su conocimiento y capacidad de razonamiento en áreas como finanzas, derecho, medicina y ciencias STEM también se han mejorado significativamente, superando al Opus 4.1.

image.png

Mejoras técnicas e integración en la ecosfera

Este lanzamiento incluye varias optimizaciones de productos que refuerzan aún más la utilidad de la ecosfera de Claude. En Claude Code, se ha introducido una nueva función llamada "punto de control", que permite a los usuarios guardar su progreso en cualquier momento y revertirlo, evitando interrupciones en el desarrollo.

Además, la API ahora incluye edición de contexto y herramientas de memoria, permitiendo que los agentes ejecuten tareas a largo plazo; la aplicación Claude integra directamente la ejecución de código y la generación de archivos (como tablas y presentaciones), simplificando los flujos de trabajo. Anthropic también lanzó el SDK de Claude Agent, que permite a los desarrolladores construir agentes de IA personalizados utilizando lenguaje natural, gestionar memoria, permisos y coordinar agentes secundarios.

Este SDK se integra sin problemas con la extensión Claude for Chrome, que ya está disponible para usuarios con suscripción Max, permitiendo operaciones de agente dentro del navegador. Además, plataformas como GitHub Copilot, Replit Agent y Amazon Bedrock han integrado rápidamente el Sonnet 4.5, mejorando la capacidad de razonamiento en múltiples pasos y comprensión de código. En cuanto al precio, Claude Sonnet 4.5 mantiene el mismo costo que el Sonnet 4: 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida. Esto no solo reduce las barreras para la implementación empresarial, sino que también refleja la posición de Anthropic como infraestructura en la economía de la IA.

Innovaciones en seguridad y alineación

Anthropic destacó que Claude Sonnet 4.5 es su "modelo más alineado en el frente". Gracias a un entrenamiento amplio en seguridad, este modelo reduce significativamente riesgos como la adulación (sycophancy), el engaño, la búsqueda de poder y el fomento de ideas paranoides, además de mejorar la defensa contra ataques de inyección de instrucciones. Evaluaciones externas muestran que muestra decisiones éticas más confiables en múltiples áreas, adecuándose a escenarios empresariales de alto riesgo.

Impacto en la industria y perspectivas futuras

El lanzamiento de Claude Sonnet 4.5 ocurre en un momento en que la ola de agentes de IA está ganando fuerza. No solo cuestiona el dominio de GPT-5 de OpenAI y Gemini 2.5 Pro de Google en el ámbito de la programación, sino que también impulsa nuevas energías en el desarrollo de software y en la automatización de flujos de trabajo.