A startup de inteligência artificial francesa Mistral AI anunciou na quarta-feira sua entrada total no campo da infraestrutura de inteligência artificial, posicionando a empresa como uma resposta europeia robusta aos gigantes de nuvem americanos. Enquanto isso, a empresa lançou um novo modelo de inferência que pode rivalizar com os sistemas mais avançados da OpenAI.
Essa empresa com sede em Paris lançou o Mistral Compute, uma plataforma abrangente de infraestrutura de IA desenvolvida em colaboração com a Nvidia. O objetivo é oferecer alternativas para empresas e governos europeus que desejam se afastar dos provedores de nuvem americanos como Amazon Web Services (AWS), Microsoft Azure e Google Cloud. Isso marca uma mudança estratégica significativa para a Mistral AI, passando de simples desenvolvimento de modelos de IA para controlar toda a pilha tecnológica.
O CEO e cofundador da Mistral AI, Arthur Mensch, declarou: "Entrar no setor de infraestrutura de IA representa um passo transformador para a Mistral AI, pois nos permite atingir um segmento vertical crucial na cadeia de valor da IA. Essa mudança significa que temos a responsabilidade de garantir que nossas soluções não apenas promovam inovação e popularização da IA, mas também mantenham a autonomia tecnológica europeia e contribuam para o liderança sustentável do continente."
Como a Mistral constrói modelos de inferência capazes de pensar em qualquer idioma
Além do anúncio da infraestrutura, a Mistral também lançou sua série de modelos de inferência Magistral — sistemas de inteligência artificial capazes de pensar logicamente em etapas, semelhantes aos modelos o1 da OpenAI e ao DeepSeek R1 da China. No entanto, o chefe científico da Mistral, Guillaume Lample, disse que o método da empresa difere dos concorrentes em aspectos-chave.
Lample revelou em uma entrevista exclusiva: "Tudo começamos do zero, principalmente porque queríamos aprender nossa própria expertise, como a flexibilidade no trabalho. Na verdade, conseguimos atingir níveis muito eficientes em um processo de aprendizado por reforço online." Ao contrário dos concorrentes que frequentemente ocultam seus processos de raciocínio, os modelos da Mistral mostram a cadeia completa de pensamento ao usuário, e, o que é crucial, eles usam a língua nativa do usuário, em vez do inglês padrão. Lample explicou: "Usamos a própria língua do usuário para mostrar a cadeia completa de pensamento, permitindo que eles realmente leiam e vejam se faz sentido."
A empresa lançou duas versões: o modelo open source Magistral Small, com 24 bilhões de parâmetros; e o sistema proprietário mais poderoso Magistral Medium, acessível via API da Mistral.
"Superpoderes" obtidos durante o treinamento dos modelos de IA
Esses modelos demonstraram capacidades surpreendentes durante o processo de treinamento. O mais notável é que, apesar de o treinamento ter se concentrado apenas em problemas matemáticos e de codificação baseados em texto, o Magistral Medium ainda retém a capacidade de inferência multimodal — ou seja, a habilidade de analisar imagens.
Lample afirmou: "Nos demos conta disso, não foi uma surpresa total. Se você reaplica o codificador visual inicial ao final do treinamento por reforço, de repente descobre que o modelo consegue fazer inferências sobre imagens."
Esses modelos também adquiriram a capacidade de chamar funções complexas, executando automaticamente pesquisas na internet em múltiplos passos e até mesmo executando código para responder a consultas complexas. Lample explicou que o modelo age como uma pesquisa na web, processa os resultados e, quando necessário, realiza outra busca. Esse comportamento surge naturalmente, sem treinamento especial, deixando a equipe "muito surpresa".
Inovação técnica: velocidade de treinamento bem superior à concorrência
A equipe técnica da Mistral superou grandes desafios de engenharia para criar uma inovação no treinamento de infraestrutura, conforme mencionado por Lample. A empresa desenvolveu um sistema de "aprendizado por reforço online" que permite que os modelos de IA melhorem continuamente enquanto geram respostas, sem depender de dados de treinamento existentes.
A inovação-chave foi sincronizar em tempo real as atualizações do modelo entre centenas de unidades de processamento gráfico (GPUs). Lample explicou: "O que fizemos foi encontrar uma maneira de realizar a migração do modelo apenas através das GPUs." Isso torna possível atualizar os pesos do modelo entre diferentes clusters de GPUs em segundos, em vez das horas tradicionais. Lample destacou: "Nenhum outro sistema de infraestrutura open source consegue fazer isso tão bem quanto nós. Frequentemente há tentativas semelhantes de código aberto, mas extremamente lentas. Aqui, nos concentramos muito na eficiência." O processo de treinamento se mostrou mais rápido e barato do que o pré-treinamento convencional, segundo Lample, levando menos de uma semana.
Engajamento da Nvidia com 18.000 chips para independência da IA na Europa
A plataforma Mistral Compute será executada em 18.000 chips Grace Blackwell mais recentes da Nvidia, inicialmente implantados em um datacenter na Essonne, França, e planejados para expandir-se pela Europa. O CEO da Nvidia, Jensen Huang, disse que essa parceria é crucial para a independência tecnológica da Europa.
Huang declarou em um comunicado conjunto em Paris: "Cada país deve construir inteligência artificial em seu próprio território, servindo seus próprios interesses. Com a Mistral AI, estamos desenvolvendo modelos e fábricas de inteligência artificial como plataformas autônomas para empresas em toda a Europa, ajudando-as a expandir a inteligência em vários setores." Huang previu que a capacidade computacional de inteligência artificial na Europa aumentará dez vezes nos próximos dois anos, com mais de 20 "fábricas de inteligência artificial" sendo planejadas no continente. Essa colaboração não se limita apenas à infraestrutura; inclui também a Nvidia trabalhando com outras empresas de IA europeias e a Perplexity, uma empresa de busca, para desenvolver modelos de inferência em várias línguas europeias, cujos conjuntos de dados de treinamento são geralmente limitados.
Resolvendo os problemas ambientais e de soberania da IA
A plataforma Mistral Compute resolve dois grandes desafios no desenvolvimento da inteligência artificial: impacto ambiental e soberania de dados. Essa plataforma garante que os clientes europeus possam armazenar suas informações dentro da União Europeia e sob jurisdição europeia.
A empresa trabalhou em parceria com a Agência Francesa de Transição Ecológica e a renomada consultoria em clima Carbone4 para avaliar e minimizar a pegada de carbono de seus modelos de IA ao longo de todo o ciclo de vida. A Mistral planeja alimentar seus datacenters com energia descarbonizada e declarou: "Ao escolher a Europa como nosso local de fabricação, podemos aproveitar a abundância de energia descarbonizada."
Vantagem de velocidade confere às máquinas de inferência da Mistral utilidade prática
Testes preliminares indicam que os modelos de inferência da Mistral não só têm excelente desempenho, mas também resolvem um problema universal presente nos sistemas atuais — a velocidade. Modelos de inferência da OpenAI e outras empresas podem levar minutos para responder a consultas complexas, limitando sua aplicação prática.
Lample observou: "Uma coisa que as pessoas normalmente não gostam nos modelos de inferência é que, embora sejam inteligentes, muitas vezes exigem muito tempo. Aqui, você realmente vê a saída em poucos segundos, às vezes menos de cinco segundos, e em alguns casos ainda mais rápido. Isso muda completamente a experiência." Essa vantagem de velocidade é crucial para a adoção corporativa, pois esperar a resposta da IA por minutos pode criar gargalos no fluxo de trabalho.
O impacto profundo do investimento da Mistral em infraestrutura na competição global da IA
A entrada da Mistral no setor de infraestrutura coloca a empresa diretamente em competição com os gigantes de nuvem dominantes do mercado tecnológico. A empresa oferece uma solução totalmente integrada verticalmente — desde a infraestrutura de hardware até os modelos de IA e serviços de software. Isso inclui o Mistral AI Studio para desenvolvedores, o Le Chat para aumentar a produtividade empresarial e o Mistral Code para auxiliar na programação.
Os analistas do setor acreditam que a estratégia da Mistral faz parte de uma tendência maior de desenvolvimento regional de inteligência artificial. Huang declarou: "Para manter a competitividade global, a Europa precisa urgentemente ampliar sua infraestrutura de inteligência artificial." Isso coincide com as preocupações dos formuladores de políticas europeus.
Esse anúncio ocorre quando os governos europeus estão cada vez mais preocupados com a dependência de empresas de tecnologia americana em infraestrutura de inteligência artificial crítica. A União Europeia comprometeu-se a investir 20 bilhões de euros para construir "superfábricas" de inteligência artificial no continente, e a parceria da Mistral com a Nvidia pode acelerar a implementação desses planos.
O anúncio da Mistral sobre a infraestrutura e as funcionalidades do modelo indica que a empresa está comprometida em ser uma plataforma de IA completa, e não apenas um provedor de modelos. Com o apoio de empresas como a Microsoft e outros investidores, a empresa já arrecadou mais de 1 bilhão de dólares e continuará buscando fundos adicionais para apoiar a expansão de seu portfólio.
Lample enxerga potencial ainda maior nos modelos de inferência, dizendo: "Quando observo os progressos internos, acredito que a precisão do modelo melhora cerca de 5% em algumas métricas de benchmark a cada semana, aproximadamente por seis semanas. Então, ele está melhorando rapidamente, há muitas e muitas ideias pequenas que podem melhorar o desempenho." Se o esforço europeu para desafiar a supremacia americana na inteligência artificial será bem-sucedido, provavelmente dependerá de clientes suficientemente interessados na soberania e sustentabilidade para mudarem de fornecedores atuais. Pelo menos por enquanto, ainda há opções disponíveis.