A Groq é uma startup de chips de IA fundada por ex-funcionários do Google. A empresa lançou um chip de aceleração de IA chamado LPU, que, por meio de inovações tecnológicas, acelera significativamente a inferência e a geração de grandes modelos, atingindo velocidades até 10 vezes superiores às de GPUs. Isso se deve principalmente ao uso de tecnologia de memória SRAM de alta velocidade e a um design de arquitetura que reduz o acesso à memória. Os usuários podem executar vários grandes modelos no LPU, como Llama e Mixtral. O lançamento do LPU ajudará a otimizar ainda mais o desempenho de grandes modelos ou a melhorar a velocidade de resposta de aplicativos como assistentes de voz e ferramentas de escrita de IA.
Velocidade de geração de modelos grandes se torna gargalo; equipe de ex-funcionários do Google desenvolve novo chip LPU

新硅
Este artigo é do AIbase Daily
Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.