Qwen2.5-Coder ist eine Reihe von großen Sprachmodellen, die für die Codegenerierung optimiert wurden und sechs gängige Modellgrößen (0,5, 1,5, 3, 7, 14 und 32 Milliarden Parameter) abdecken, um den Bedürfnissen verschiedener Entwickler gerecht zu werden. Qwen2.5-Coder weist deutliche Verbesserungen in Bezug auf Codegenerierung, Code-Inferenz und Code-Reparatur auf. Basierend auf dem leistungsstarken Qwen2.5 wurde das Training mit 5,5 Billionen Token erweitert, darunter Quellcode, Text-Code-Grounding und synthetische Daten. Es ist das derzeit fortschrittlichste Open-Source Code-LLM und seine Codierfähigkeit entspricht der von GPT-4o. Darüber hinaus bietet Qwen2.5-Coder eine umfassendere Basis und eignet sich für Anwendungen wie Code-Agenten in der realen Welt.