Mistral hat kürzlich ein Upgrade seines Open-Source-Codegenerierungsmodells Codestral angekündigt und die neue Version Codestral25.01 veröffentlicht. Dieses Update stärkt die Wettbewerbsfähigkeit des Modells im Bereich der Programmierung deutlich und zielt darauf ab, Entwicklern ein effizienteres Codegenerierungserlebnis zu bieten.

image.png

Laut dem Blogbeitrag von Mistral wurde die Architektur von Codestral25.01 optimiert und verspricht, unter ähnlichen Modellen „absoluter Marktführer“ zu sein. Die Codegenerierungsgeschwindigkeit ist doppelt so hoch wie bei der Vorgängerversion. Die neue Version behält die Vorteile des ursprünglichen Modells bei, konzentriert sich auf niedrige Latenzzeiten und hochfrequente Operationen und unterstützt Aufgaben wie Codekorrektur, Testgenerierung und Codevervollständigung. Mistral betont, dass dies besonders wichtig für Unternehmen mit großen Datenmengen und Szenarien mit residenten Modellen ist.

image.png

In verschiedenen Benchmark-Tests schnitt Codestral25.01 in Python-Codierungstests hervorragend ab und erzielte im HumanEval-Test eine hohe Punktzahl von 86,6 %, womit es die vorherigen Versionen von Codestral, Codellama70B Instruct und DeepSeek Coder33B Instruct übertraf.

Entwickler können Codestral25.01 über die IDE-Plugin-Partner von Mistral nutzen. Darüber hinaus können Benutzer über die Plattform von Mistral und Google Vertex AI auf die API des Modells zugreifen. Derzeit wird das Modell in der Azure AI Foundry als Vorschau angeboten und wird bald auch auf Amazon Bedrock verfügbar sein.

image.png

Seit der ersten Veröffentlichung von Codestral im Mai 2023 treibt Mistral die Weiterentwicklung und Innovation seiner Produkte voran. Das zuvor veröffentlichte Codestral-Mamba-Modell basiert auf der Mamba-Architektur und kann längere Code-Strings generieren und mehr Eingaben verarbeiten. Bemerkenswert ist, dass Codestral25.01 innerhalb weniger Stunden nach der Ankündigung von Mistral schnell in der Rangliste von Copilot Arena aufgestiegen ist, was das große Interesse des Marktes an diesem neuen Modell zeigt.

Das Schreiben von Code war eine der frühen Funktionen von Basismodellen und wurde auch in allgemeinen Modellen wie OpenAIs o3 und Anthropics Claude eingesetzt. In den letzten zwölf Monaten haben sich jedoch spezialisierte Programmiermodelle deutlich weiterentwickelt und übertreffen oft große allgemeine Modelle. Kürzlich haben auch Alibaba, DeepSeek Coder und Microsoft neue Programmiermodelle veröffentlicht, was den Wettbewerb verschärft.

Unter Entwicklern gibt es immer noch Diskussionen darüber, ob man sich für allgemeine Modelle oder auf Programmierung spezialisierte Modelle entscheiden sollte. Einige Entwickler bevorzugen allgemeine Modelle wie Claude, während die Anforderungen an Programmieraufgaben die Entwicklung spezialisierter Modelle vorantreiben. Da Codestral speziell für Codedaten trainiert wurde, schneidet es bei Programmieraufgaben natürlich besser ab.

Offizieller Blog: https://mistral.ai/news/codestral-2501/

Highlights:

🌟 Mistral veröffentlicht Codestral25.01 mit einer doppelt so hohen Codegenerierungsgeschwindigkeit im Vergleich zur Vorgängerversion.

💻 Das Modell schneidet in Python-Codierungstests hervorragend ab und erreicht 86,6 % im HumanEval-Test.

📈 Codestral25.01 steigt schnell in der Copilot Arena auf Platz 1 und genießt große Aufmerksamkeit bei Entwicklern.