Eine französische Gründerfirma namens Mistral hat erneut die Aufmerksamkeit auf sich gezogen, da sie mit dem Open-Source-Team All Hands AI eine neue Sprachmodellierung namens Devstral vorgestellt hat. Dieses Modell verfügt über 24 Milliarden Parameter und benötigt deutlich weniger Rechenressourcen als viele vergleichbare Produkte, was es zu einer idealen Wahl für lokale Installationen und Geräteidealeinstellungen macht. Nutzer mit einer RTX4090-Grafikkarte oder 32 GB RAM können Devstral problemlos ausführen, was eine flexible Benutzererfahrung ermöglicht.
In der Open-Source-Community steigender Beliebtheit hat Mistral durch Devstral seinen Stellenwert unter den Entwicklern demonstriert. Obwohl das Unternehmen mit seinem Medium3-Modell Kritik am Fehlen eines Open-Source-Ansatzes erfahren hat, ist die derzeitige Öffnungshaltung von großer Begeisterung. Devstral folgt der liberalen Apache2.0-Lizenz, die es Entwicklern und Organisationen erlaubt, das Modell frei zu modifizieren, bereitzustellen und kommerziell zu nutzen, was neue Möglichkeiten für zahlreiche Projekte eröffnet.
Quellenhinweis: Das Bild wurde von einer KI generiert, der Bildlizenz-Dienstleister ist Midjourney.
Die grundlegende Idee hinter Devstral war es, realweltliche Probleme der Software-Ingenieurarbeit zu lösen. Während viele große Sprachmodelle bei Programmieraufgaben wie der Erstellung unabhängiger Funktionen oder Code-Vervollständigung hervorragend funktionieren, haben sie Schwierigkeiten, komplexe Codebibliotheken im Kontext zu verarbeiten. Devstral konzentriert sich genau auf diesen Bereich und ist in der Lage, echte Probleme auf GitHub effektiv zu lösen und mit OpenHands und SWE-Agent Codeintelligenz-Frameworks kompatibel zu sein.
Nach der Top-Software-Ingenieur-Benchmark SWE-Bench Verified erzielte Devstral herausragende Resultate mit einem Score von 46,8 %, was deutlich über anderen Open-Source-Modellen liegt und sogar einige geschlossenen Modelle wie GPT-4.1-mini um 20 Prozentpunkte übertreffen. Diese Leistung zeigt das Potenzial von Devstral in der tatsächlichen Programmierfähigkeit.
In derselben Testframework strahlte Devstral auch über viele Parametern größeren Modellen wie Deepseek-V3-0324 und Qwen3232B-A22B hinaus. Seine bemerkenswerte Effizienz und überlegene Performance haben Entwicklern viel Lob eingebracht.
Zusätzlich ist Devstral über Mistral's Le Platforme API zugänglich, wobei die Kosten je Million Eingabe-Token 0,10 USD und je Million Ausgabe-Token 0,30 USD betragen, was besonders kostengünstig ist.