Die europäische AI-Start-up-Firma Multiverse Computing hat kürzlich zwei extrem kleine KI-Modelle veröffentlicht, die so klein sind, dass sie mit dem Gehirn eines Huhns oder einer Fliege bezeichnet werden können. Die Firma behauptet, dass es sich um die kleinsten Modelle der Welt handelt, die dennoch eine hohe Leistung aufweisen. Sie können Chatfunktionen und Spracherkennung verarbeiten, wobei eines der Modelle sogar über Inferenzfähigkeit verfügt.
Diese ultrakleinen Modelle sind für IoT-Geräte konzipiert und können lokal auf Smartphones, Tablets und PCs laufen. Der Gründer der Firma, Roman Ollus, sagte gegenüber TechCrunch: „Wir können die Modelle so stark komprimieren, dass sie auf verschiedene Geräte passen. Sie können sie lokal ausführen, direkt auf einem iPhone, sogar auf einem Apple Watch.“
Multiverse Computing ist in Donostia, Spanien ansässig und hat Niederlassungen weltweit. Das Unternehmen beschäftigt etwa 100 Mitarbeiter und ist eine vielversprechende AI-Start-up-Firma in Europa. Es wurde von Roman Ollus, einem renommierten Professor für Quantenrechnung und Physik in Europa, Samuel Mugger, einem Experten für Quantenrechnung, und Enrique Lissaso Ormós, ehemaligem stellvertretenden CEO von Unnim Bank, gegründet.
Im Juni dieses Jahres hat die Firma erfolgreich 189 Millionen Euro (ca. 215 Millionen US-Dollar) mit ihrer Modellkomprimierungstechnologie namens „CompactifAI“ finanziert. Seit ihrer Gründung im Jahr 2019 hat das Unternehmen insgesamt rund 250 Millionen US-Dollar gesammelt.
CompactifAI ist ein quanteninspirierter Komprimierungsalgorithmus, der die Größe bestehender KI-Modelle verringert, ohne deren Leistung zu beeinträchtigen. Ollus erklärte: „Unsere Komprimierungstechnik ist nicht die typische Komprimierungstechnik, die in Informatik oder maschinellem Lernen verwendet wird, da wir aus der Quantenphysik kommen. Es handelt sich um einen eleganteren und präziseren Komprimierungsalgorithmus.“
Das Unternehmen hat bereits viele komprimierte Versionen von Open-Source-Modellen veröffentlicht, insbesondere populäre kleine Modelle wie Llama4Scout oder Mistral Small3.1, und hat kürzlich auch komprimierte Versionen zweier neuer Open-Source-Modelle von OpenAI veröffentlicht. Außerdem wurden einige große Modelle komprimiert, wie beispielsweise die DeepSeek R1Slim-Version.
Multiverse, das sich auf die Miniaturisierung von Modellen spezialisiert hat, investiert zusätzliche Kraft in die Entwicklung möglichst kleiner, aber leistungsstarker Modelle. Die beiden neuen Modelle sind so klein, dass sie fast jedem IoT-Gerät Chat-KI-Funktionen bieten können, und benötigen keine Internetverbindung. Das Unternehmen nennt diese Reihe humorvoll „Modell-Zoo“, da die Produkte nach der Größe des Tiergehirns benannt sind.
Das Modell namens SuperFly ist eine komprimierte Version des Open-Source-Modells SmolLM2-135 von Hugging Face. Das Originalmodell hat 135 Millionen Parameter und wurde für die Nutzung auf Geräten entwickelt. SuperFly wurde auf 94 Millionen Parameter komprimiert, wobei Ollus es mit der Größe eines Fliegengehirns vergleicht. Er sagte: „Es ist, als hätte man eine Fliege, aber etwas intelligenter.“
SuperFly wurde für die Ausbildung auf äußerst begrenzten Daten entworfen, wie z.B. Gerätedaten. Multiverse möchte es in Haushaltsgeräten einbetten, sodass Benutzer Geräte per Sprachbefehlen bedienen können, wie „Starte den schnellen Waschgang“ oder Fragen zur Fehlerbehebung stellen. Mit nur geringer Verarbeitungskapazität (wie Arduino) kann dieses Modell Sprachoberflächen verarbeiten, was das Unternehmen gegenüber TechCrunch live demonstrierte.
Das andere Modell, ChickBrain, ist größer mit 3,2 Milliarden Parametern, hat aber auch leistungsstärkere Funktionen und verfügt über Inferenzfähigkeit. Multiverse gibt an, dass es sich um eine komprimierte Version des Meta Llama3.18B-Modells handelt, aber so klein, dass es auf einem MacBook laufen kann, ohne eine Internetverbindung zu benötigen.
Wichtiger noch, Ollus betonte, dass ChickBrain in mehreren Standardbenchmarks tatsächlich leicht besser abschnitt als das Originalmodell, einschließlich des Sprachfähigkeitsbenchmarks MMLU-Pro, des Mathematikfähigkeitsbenchmarks Math500 und GSM8K sowie des Allgemeinwissen-Benchmarks GPQA Diamond.
Zu beachten ist, dass Multiverse nicht behauptet, dass ihre Modell-Zoo-Modelle in diesen Benchmarks die größten und fortschrittlichsten Modelle schlagen würden, und die Leistung des Zoos könnte sogar nicht auf den Rankings erscheinen. Der Schlüssel liegt darin, dass die Technologie des Unternehmens die Modellgröße verringert, ohne die Leistung zu beeinträchtigen.
Ollus sagte, dass das Unternehmen bereits Gespräche mit allen führenden Geräte- und Haushaltsgeräteherstellern führt. Er sagte: „Wir verhandeln mit Apple und sprechen auch mit Samsung, Sony und HP. HP war bei der letzten Finanzierung als Investor beteiligt.“ Diese Finanzierung wurde von der bekannten europäischen Venture-Capital-Firma Bullhound Capital angeführt, wobei auch Institutionen wie HP Tech Ventures und Toshiba beteiligt waren.
Das Start-up bietet seine Komprimierungstechnologie auch für andere Formen des maschinellen Lernens an, wie Bilderkennung, und hat in sechs Jahren Kunden wie BASF, Ally, Moody's und Bosch gewonnen.