La startup de inteligencia artificial francesa Mistral AI anunció el miércoles su entrada total en el campo de la infraestructura de inteligencia artificial, posicionándose como una respuesta sólida de Europa a los gigantes de la nube estadounidenses. Al mismo tiempo, la empresa lanzó un nuevo modelo de inferencia que puede rivalizar con los sistemas más avanzados de OpenAI.

Esta compañía con sede en París lanzó Mistral Compute, una plataforma integral de infraestructura de IA construida en colaboración con Nvidia, destinada a proporcionar alternativas para empresas y gobiernos europeos, reduciendo así la dependencia de proveedores de nube estadounidenses como AWS, Microsoft Azure y Google Cloud. Este paso marca un cambio estratégico importante para Mistral AI, que se está transformando de un simple desarrollador de modelos de IA hacia el control completo de todo el stack tecnológico.

Arthur Mensch, CEO y cofundador de Mistral AI, declaró: "El ingreso al campo de la infraestructura de IA representa un paso transformador para Mistral AI, ya que nos permite abordar un área clave de la cadena de valor de la IA. Esta transformación significa que tenemos la responsabilidad de asegurar que nuestras soluciones no solo promuevan la innovación y la popularización de la IA, sino también mantengan la autonomía tecnológica europea y contribuyan al liderazgo sostenible del continente en este ámbito".

mistral

Cómo Mistral construye modelos de inferencia capaces de pensar en cualquier idioma

Aparte del anuncio de la infraestructura, Mistral también lanzó su serie de modelos de inferencia Magistral, estos sistemas de inteligencia artificial pueden realizar pensamiento lógico progresivo, similar a los modelos o1 de OpenAI y DeepSeek R1 de China. Sin embargo, Guillaume Lample, científico jefe de Mistral, señaló que el enfoque de la empresa difiere de sus competidores en aspectos clave.

Lample reveló en una entrevista exclusiva: "Hemos comenzado todo desde cero, principalmente porque queríamos aprender de nuestros conocimientos existentes, como la flexibilidad en el trabajo. En realidad, hemos logrado un nivel muy eficiente en un proceso de aprendizaje por refuerzo en línea". A diferencia de los competidores que suelen ocultar el proceso de razonamiento, los modelos de Mistral muestran la cadena completa de pensamiento al usuario, y lo más importante, utilizan el idioma materno del usuario, en lugar del inglés predeterminado. Lample explicó: "Mostramos la cadena completa de pensamiento en el propio idioma del usuario, de modo que puedan leer realmente y ver si tiene sentido para ellos".

La empresa lanzó dos versiones: un modelo Magistral Small de código abierto con 24 mil millones de parámetros; y un sistema más potente Magistral Medium accesible a través del API de Mistral.

Las "habilidades sobrehumanas" obtenidas durante el entrenamiento de modelos de IA

Estos modelos mostraron capacidades sorprendentes durante el proceso de entrenamiento. Lo más notable fue que, aunque el entrenamiento se centró únicamente en problemas matemáticos y de codificación basados en texto, Magistral Medium conservó la capacidad de inferencia multimodal —la habilidad de analizar imágenes—.

Lample afirmó: "Nos dimos cuenta de que esto no fue completamente accidental, sino algo que absolutamente no esperábamos. Si, al final del entrenamiento por refuerzo, vuelves a insertar el codificador visual inicial, de repente descubres que el modelo puede hacer inferencias sobre imágenes".

Además, estos modelos obtuvieron la capacidad de invocar funciones complejas y realizar búsquedas automatizadas en múltiples pasos en Internet y ejecutar código para responder consultas complejas. Lample explicó que el modelo realiza búsquedas en línea como lo haría un humano, procesa los resultados y, si es necesario, vuelve a buscar. Este comportamiento se formó naturalmente sin necesidad de entrenamiento especial, lo que dejó al equipo "muy sorprendido".

Innovaciones técnicas: Velocidad de entrenamiento mucho mayor que la de los competidores

El equipo técnico de Mistral superó grandes desafíos técnicos y creó una ruptura en la infraestructura de entrenamiento según Lample. La empresa desarrolló un sistema de aprendizaje por refuerzo en línea que permite que los modelos de IA mejoren constantemente mientras generan respuestas, sin depender de datos de entrenamiento previos.

La innovación clave radica en la sincronización en tiempo real de las actualizaciones del modelo entre cientos de unidades de procesamiento gráfico (GPU). Lample explicó: "Lo que hicimos fue encontrar una manera de realizar las actualizaciones del modelo simplemente a través de las GPU". Esto permitió que el sistema actualizara los pesos del modelo entre diferentes clusters de GPU en segundos, en lugar de las horas que normalmente toman.

Lample señaló: "No hay ninguna infraestructura de código abierto que lo haga tan bien. Generalmente, hay muchos intentos similares de código abierto para hacer esto, pero son extremadamente lentos. Aquí, estamos muy enfocados en la eficiencia". Se demostró que el proceso de entrenamiento era más rápido y menos costoso que los métodos de preentrenamiento tradicionales, dijo Lample, y podría completarse en menos de una semana.

Nvidia compromete 18,000 chips para la independencia de IA en Europa

La plataforma Mistral Compute funcionará con 18,000 chips Grace Blackwell más recientes de Nvidia, inicialmente desplegados en un centro de datos en Essonne, Francia, y planificados para expandirse a toda Europa. Jensen Huang, CEO de Nvidia, dijo que esta colaboración es crucial para la independencia tecnológica de Europa.

Huang declaró en un comunicado conjunto en París: "Cada país debería construir inteligencia artificial en su propia nación para servir a su población. A través de Mistral AI, estamos desarrollando modelos y fábricas de inteligencia artificial como plataformas autónomas para empresas en toda Europa, ayudando a estas empresas a expandir la inteligencia en todos los sectores". Huang predijo que en los próximos dos años, la capacidad de computación de IA en Europa aumentará diez veces, y el continente planea establecer más de 20 "fábricas de inteligencia artificial".

Esta colaboración no solo se limita a infraestructura, sino que también incluye la cooperación entre Nvidia y otras empresas de IA europeas, así como la empresa de búsqueda Perplexity, para desarrollar modelos de inferencia en varios idiomas europeos, donde los datos de entrenamiento suelen ser limitados.

Solucionando los problemas ambientales y soberanos de la IA

Mistral Compute aborda dos grandes problemas del desarrollo de la IA: el impacto ambiental y la soberanía de los datos. La plataforma asegura que los clientes europeos puedan almacenar su información dentro de la Unión Europea y bajo jurisdicción europea.

La empresa trabajó con la Agencia Francesa de Transición Ecológica y la prestigiosa consultora de clima Carbone4 para evaluar y minimizar la huella de carbono de sus modelos de IA a lo largo de todo su ciclo de vida. Mistral planea alimentar sus centros de datos con energía descarbonizada y declaró: "Al elegir Europa como nuestro lugar de fabricación, podemos beneficiarnos de una gran cantidad de energía descarbonizada".

Ventaja de velocidad otorgada a los modelos de inferencia de Mistral

Los primeros tests indican que los modelos de inferencia de Mistral no solo ofrecen un rendimiento excelente, sino que también resuelven un problema generalizado en los sistemas actuales: la velocidad. Los modelos de inferencia actuales de OpenAI y otras empresas pueden tardar varios minutos en responder consultas complejas, lo que limita sus aplicaciones prácticas.

Lample señaló: "Una de las cosas que a las personas no les gusta de estos modelos de inferencia es que, aunque son inteligentes, a veces tardan mucho tiempo. Aquí, en cambio, puedes ver la salida en segundos, a veces menos de cinco segundos, y a veces incluso más rápido. Esto cambia la experiencia". La ventaja de velocidad es crucial para la adopción empresarial, ya que esperar varios minutos para que la IA responda puede causar atascos en los flujos de trabajo.

El impacto a largo plazo de la inversión en infraestructura de Mistral en la competencia global de IA

El ingreso de Mistral al campo de la infraestructura le permite competir directamente con los gigantes tecnológicos que dominan el mercado de la nube. La empresa ofrece una solución completamente integrada verticalmente, desde la infraestructura de hardware hasta los modelos de IA y los servicios de software. Esto incluye Mistral AI Studio para desarrolladores, Le Chat para mejorar la productividad empresarial y Mistral Code para asistencia en programación.

Los analistas del sector consideran que la estrategia de Mistral es parte de una tendencia más amplia de desarrollo regional de la IA. Huang expresó: "Para mantenerse competitiva en el mundo, Europa necesita urgentemente expandir su infraestructura de inteligencia artificial". Esto coincide con las preocupaciones de los formuladores de políticas europeos.

Este anuncio se produce en un momento en que los gobiernos de varios países europeos están cada vez más preocupados por su dependencia de las empresas tecnológicas estadounidenses en infraestructuras críticas de inteligencia artificial. La Unión Europea ha comprometido 20 mil millones de euros para construir "superfábricas" de inteligencia artificial en el continente, y la colaboración entre Mistral y Nvidia podría acelerar la implementación de estos planes.

El anuncio de Mistral sobre la infraestructura y las funciones del modelo indica que la empresa está comprometida a convertirse en una plataforma de IA integral, y no solo un proveedor de modelos. Con el apoyo de Microsoft y otros inversores, la empresa ya ha recaudado más de mil millones de dólares y continuará buscando fondos adicionales para expandir su alcance.

Lample ve mayores posibilidades futuras para los modelos de inferencia, señalando: "Cuando observo los avances internos, creo que en algunas pruebas de referencia, la precisión del modelo mejora aproximadamente un 5% cada semana durante seis semanas. Así que está mejorando rápidamente, muchas muchas ideas pequeñas que se pueden implementar para mejorar el rendimiento". El éxito del esfuerzo de Europa para desafiar la supremacía de la inteligencia artificial estadounidense probablemente dependerá de si los clientes valoran suficientemente la soberanía y la sostenibilidad, lo que les haría dispuestos a abandonar proveedores existentes. Por ahora, al menos, todavía tienen opciones.