DeepSeek-Coder-V2 est un modèle linguistique de code open source de type Mixture-of-Experts, dont les performances sont comparables à celles de GPT4-Turbo, et qui se distingue par ses performances exceptionnelles sur des tâches spécifiques liées au code. Pré-entraîné sur 6 000 milliards de jetons supplémentaires, il voit ses capacités de codage et de raisonnement mathématique renforcées, tout en conservant des performances similaires sur les tâches linguistiques générales. Comparé à DeepSeek-Coder-33B, il affiche des progrès significatifs en matière de tâches liées au code, de raisonnement et de capacités générales. De plus, il prend en charge 338 langages de programmation (contre 86 précédemment) et la longueur du contexte passe de 16 K à 128 K.