Hier, XPeng Motors a organisé à Hong Kong un atelier sur l’intelligence artificielle, dévoilant pour la première fois son modèle d’entraînement automatique à très grande échelle de 72 milliards de paramètres : le « modèle de base XPeng ». Ce modèle, basé sur une architecture multimodale, intègre la compréhension visuelle, le raisonnement en chaîne et la génération d’actions. Son déploiement en embarqué est prévu grâce à une technique de distillation par le cloud, et il alimentera simultanément les robots IA et les voitures volantes, entre autres produits écosystémiques.
Selon Li Liyun, responsable de la conduite autonome chez XPeng Motors, le modèle de base s’appuie sur un grand modèle linguistique, entraîné à partir d’un volume massif de données de conduite. Il possède une capacité d’auto-apprentissage. Grâce à un mécanisme d’apprentissage par renforcement, le modèle améliorera continuellement l’efficacité des décisions, visant à atteindre un niveau de conduite autonome surpassant les capacités humaines. Pour soutenir ce développement, XPeng Motors a accéléré le déploiement de ses infrastructures IA depuis 2023, construisant le premier cluster de calcul de 10 000 cartes graphiques du secteur automobile chinois. Sa capacité de calcul atteint 10 EFLOPS, avec un taux d’utilisation stable à plus de 90 %, et un pic d’efficacité dépassant les 98 %.
XPeng Motors a nommé « usine de modèles cloud » ce processus complet, de l’entraînement dans le cloud au déploiement embarqué. Il englobe les étapes de pré-entraînement, d’entraînement postérieur, de distillation des modèles et d’adaptation embarquée. Actuellement, cette usine effectue une itération complète en moyenne tous les 5 jours, le volume de données vidéo d’entraînement passant de 20 millions de clips à un objectif de 200 millions de clips cette année. L’équipe de R&D a également développé des modèles de base de différentes tailles. Le modèle 72B, avec ses 72 milliards de paramètres, représente 35 fois le volume de paramètres des modèles VLA courants, marquant une avancée significative dans les capacités de calcul de XPeng en matière de conduite autonome.
En termes de stratégie technique, XPeng Motors utilise l’« usine de modèles cloud » pour boucler la boucle de données : après un pré-entraînement et un apprentissage par renforcement dans le cloud, le modèle de base est comprimé en une version légère avant d’être déployé embarqué. Cette architecture prend en charge non seulement la mise à niveau intelligente des modèles existants, mais fournit également les capacités de base aux robots IA et aux voitures volantes, entre autres produits de pointe.
Il a été annoncé officiellement qu’XPeng Motors a lancé la construction de ses infrastructures IA (IA Infra) en 2024. Un système complet couvrant la collecte de données, l’entraînement des modèles et la mise en œuvre sur le terrain a été mis en place. Trois résultats intermédiaires sont apparus : la validation de l’efficacité continue de la loi d’échelle dans le domaine de la conduite autonome, la réalisation du contrôle du véhicule par le modèle de base sur des calculateurs embarqués post-équipement et le lancement de l’entraînement du modèle à 72 milliards de paramètres et la construction d’un cadre spécifique à l’apprentissage par renforcement. À l’avenir, le modèle de base XPeng sera étroitement intégré à l’écosystème IA, favorisant l’évolution conjointe des voitures intelligentes et de la robotique.