Recientemente, en el mundo de la inteligencia artificial ha llegado una gran noticia: Anthropic ha lanzado oficialmente su serie de modelos Claude4, que incluye Claude Opus4 y Claude Sonnet4. Este anuncio no vino con eslóganes llamativos ni un largo artículo de investigación; solo había una palabra clave: "trabajar". Según Anthropic, Claude Opus4 es considerado el modelo de programación más poderoso del mundo, capaz de manejar tareas complejas y a largo plazo de manera estable y eficiente. Por otro lado, Claude Sonnet4 ha sido mejorado en capacidades de programación y razonamiento, permitiendo responder con mayor precisión a las instrucciones de los usuarios.
La serie Claude4 trae varias funciones nuevas emocionantes. En primer lugar, el modelo puede usar herramientas auxiliares durante su proceso de pensamiento profundo para optimizar la lógica de sus respuestas y mejorar la calidad. Además, ambos modelos pueden usar estas herramientas simultáneamente y, bajo la autorización del desarrollador, aumentar su capacidad de memoria para retener información clave y mantener la coherencia contextual. También se ha lanzado Claude Code, lo que hace que esta serie de modelos sea aún más útil en plataformas como GitHub Actions, VS Code y JetBrains.
En las pruebas de referencia de programación SWE-bench, Opus4 obtuvo un 72.5% de puntuación destacándose entre otros modelos, y también lideró en Terminal-bench con un 43.2%, demostrando sus excelentes habilidades de programación. Opus4 incluso puede descomponer problemas como un experimentado programador, ajustar errores precisamente y ejecutar tareas complejas, incluso mostrando buen desempeño en pruebas en Replit al manejar proyectos con múltiples archivos y grandes cambios.
Comparado con Opus4, aunque Sonnet4 no necesariamente es el más potente, probablemente será más atractivo para la mayoría de los desarrolladores. En comparación con su predecesor, ha mejorado claramente en habilidades de programación, razonamiento lógico y control de respuesta, alcanzando un rendimiento de 72.7%. En la tarea de procesar instrucciones complejas, Sonnet4 muestra un comportamiento más claro y estructuras de código más elegantes, por lo que se ha seleccionado como el modelo base para la nueva generación de GitHub Copilot.
Con el desarrollo continuo de la tecnología AI, Anthropic también ha optimizado el comportamiento y el razonamiento de los modelos. La serie Claude4 puede realizar tareas de razonamiento complejas de manera efectiva y reducir significativamente las tasas de errores lógicos en las pruebas. Además, la nueva función "resumen del pensamiento", que se activa cuando el modelo tiene un razonamiento demasiado extenso, comprime e interpreta la información automáticamente para hacerla más clara y concisa.
Con el lanzamiento oficial de Claude Code, los desarrolladores podrán integrar fácilmente este poderoso asistente de IA en sus flujos de trabajo. Ya sea en terminales o en IDEs comunes, Claude Code puede ser insertado en escenarios de desarrollo reales, proporcionando sugerencias de modificación de código para hacer el proceso de desarrollo más eficiente.