【Reportagem da AIbase】A IBM anunciou uma parceria estratégica com a startup de chips Groq, integrando sua tecnologia de inferência de alto desempenho à plataforma watsonx, para oferecer soluções de inteligência artificial mais rápidas e econômicas para seus clientes corporativos. Essa parceria marca um passo importante para a IBM no campo de aceleração de IA em nível corporativo.

Através dessa parceria, os usuários da IBM poderão acessar diretamente o serviço GroqCloud no Watsonx Orchestrate. A Groq é conhecida por sua arquitetura de unidade de processamento de linguagem (LPU), alegando que pode ser mais de cinco vezes mais rápida do que sistemas tradicionais baseados em GPU em tarefas específicas de inferência de IA, ao mesmo tempo em que reduz significativamente o consumo de energia e os custos.

IBM

A IBM afirma que a integração das tecnologias das duas partes será priorizada em cenários de saúde e varejo. Por exemplo, no setor de saúde, o sistema pode responder eficientemente a milhares de consultas de pacientes simultaneamente; no setor de varejo, pode ser usado para automação inteligente de recursos humanos e cadeia de suprimentos. Além disso, a IBM e a Groq planejam combinar a tecnologia vLLM de código aberto da Red Hat com o hardware LPU da Groq, para aumentar a flexibilidade na implantação de modelos e permitir que o GroqCloud suporte o modelo Granite da IBM. Atualmente, os clientes da IBM já podem usar diretamente as funcionalidades principais do GroqCloud.

Fundada em 2016, a Groq possui mais de 2 milhões de desenvolvedores e se posiciona como uma alternativa às GPUs, sendo também um membro importante da "Pilha de IA dos EUA". Essa parceria não apenas melhorará o desempenho computacional da watsonx, mas também visa ajudar os clientes corporativos a expandir agentes de IA das fases de teste para ambientes de produção, abrangendo setores como saúde, finanças, governo, varejo e manufatura, onde a velocidade, custo e confiabilidade são extremamente importantes.