A empresa de IA europeia Multiverse Computing lançou recentemente dois modelos de IA extremamente pequenos, tão pequenos que podem ser nomeados com base no cérebro de uma galinha ou um mosquito. A empresa afirma que são os modelos mais pequenos do mundo, mas ainda mantêm alto desempenho, capazes de lidar com conversas e reconhecimento de voz, sendo que um deles também possui capacidade de raciocínio.

Esses modelos ultrapequenos foram projetados especificamente para dispositivos IoT, mas também podem ser executados localmente em smartphones, tablets e computadores pessoais. O fundador da empresa, Roman Orus, disse à TechCrunch: "Podemos comprimir os modelos até esse ponto, permitindo que sejam compatíveis com vários dispositivos. Você pode executá-los localmente, diretamente no iPhone, até mesmo no Apple Watch."

A Multiverse Computing está sediada em Donostia, na Espanha, com escritórios em todo o mundo, e tem aproximadamente 100 funcionários, sendo uma das empresas de IA emergentes mais observadas na Europa. A empresa foi fundada por Roman Orus, professor de computação quântica e física de topo na Europa, Samuel Mugge, especialista em computação quântica, e Enrique Lissaso Ormos, ex-CFO da Unnim Bank.

image.png

No mês de junho, a empresa conseguiu levantar 189 milhões de euros (cerca de 215 milhões de dólares) graças à sua tecnologia de compressão de modelos chamada "CompactifAI". Desde sua criação em 2019, a empresa arrecadou cerca de 250 milhões de dólares.

O CompactifAI é um algoritmo de compressão inspirado pela física quântica, que reduz o tamanho dos modelos de IA existentes sem comprometer seu desempenho. Orus explicou: "Nossa tecnologia de compressão não é a típica técnica de compressão usada por pessoas da ciência da computação ou aprendizado de máquina, pois viemos do background de física quântica. É um algoritmo de compressão mais sofisticado e refinado."

A empresa já publicou versões comprimidas de muitos modelos abertos, especialmente modelos pequenos populares como Llama4Scout ou Mistral Small3.1, e acabou de lançar versões comprimidas de dois novos modelos abertos da OpenAI. A empresa também comprimiu alguns modelos grandes, como a versão DeepSeek R1Slim.

Com foco na miniaturização de modelos, a Multiverse dedica atenção extra à criação de modelos tão pequenos quanto possível, mas ainda funcionais. Seus dois novos modelos são tão pequenos que podem trazer funcionalidades de IA de chat para praticamente qualquer dispositivo IoT, sem necessidade de conexão à internet. A empresa chama carinhosamente essa série de "Zoológico de Modelos", pois os produtos são nomeados com base no tamanho do cérebro de animais.

O modelo chamado SuperFly é uma versão comprimida do modelo aberto da Hugging Face SmolLM2-135. O modelo original tem 135 milhões de parâmetros, desenvolvido especificamente para uso em dispositivos. O SuperFly foi comprimido para 94 milhões de parâmetros, e Orus o compara ao tamanho de um cérebro de mosquito. Ele disse: "Isso é como ter um mosquito, mas um pouco mais inteligente."

O SuperFly foi projetado especificamente para treinamento em dados extremamente limitados, como dados de operação de dispositivos. A Multiverse imagina integrá-lo em eletrodomésticos domésticos, permitindo que os usuários comandem dispositivos por meio de comandos de voz, como dizer "começar lavagem rápida" para a máquina de lavar, ou perguntar sobre problemas de falhas. Com pouca capacidade de processamento (como o Arduino), o modelo pode lidar com interfaces de voz, e a empresa realizou uma demonstração ao vivo para a TechCrunch.

O outro modelo, chamado ChickBrain, é maior, com 3,2 bilhões de parâmetros, mas também é mais poderoso, com capacidade de raciocínio. A Multiverse afirma que é uma versão comprimida do modelo Meta Llama3.18B, mas pequeno o suficiente para ser executado em um MacBook sem necessidade de conexão à internet.

Além disso, Orus afirmou que o ChickBrain superou ligeiramente o modelo original em vários benchmarks padrão, incluindo benchmarks de habilidades linguísticas MMLU-Pro, benchmarks de habilidades matemáticas Math500 e GSM8K, bem como benchmarks de conhecimento geral GPQA Diamond.

É importante notar que a Multiverse não afirma que seu "zoológico de modelos" vencerá os maiores modelos avançados nos testes de benchmark, e o desempenho do zoológico pode nem mesmo aparecer nas listas de classificação. O ponto principal é que a tecnologia da empresa consegue reduzir o tamanho dos modelos sem comprometer o desempenho.

Orus disse que a empresa está negociando com todos os principais fabricantes de dispositivos e eletrodomésticos. Ele disse: "Estamos negociando com a Apple, também estamos conversando com Samsung, Sony e HP. A HP participou da última rodada de investimento." Essa rodada foi liderada pela renomada empresa de capital de risco europeia Bullhound Capital, com participação de instituições como HP Tech Ventures e Toshiba.

A startup também fornece tecnologia de compressão para outros tipos de aprendizado de máquina, como reconhecimento de imagens, e, em seis anos, já conquistou clientes como BASF, Ally, Moody's e Bosch.

Além de vender modelos diretamente aos principais fabricantes de dispositivos, a Multiverse também oferece modelos comprimidos por meio de APIs hospedadas na AWS, disponíveis para qualquer desenvolvedor, geralmente com taxas mais baixas por token do que seus concorrentes.