Ontem, a XPeng Motors realizou um evento de compartilhamento de tecnologia de IA em Hong Kong, revelando pela primeira vez seu modelo de direção autônoma de grande escala com 72 bilhões de parâmetros em desenvolvimento – o "Modelo de Base do Mundo XPeng". Este modelo tem como núcleo uma arquitetura multimodal, integrando compreensão visual, raciocínio em cadeia e capacidade de geração de ações. O objetivo é implantá-lo em veículos por meio da tecnologia de destilação em nuvem, além de fornecer suporte a produtos ecossistemas como robôs de IA e carros voadores.
Segundo Li Liyun, responsável pela direção autônoma da XPeng Motors, o modelo de base usa modelos de linguagem grandes como espinha dorsal, sendo treinado com uma grande quantidade de dados de direção e possuindo capacidade de autoevolução. Por meio de um mecanismo de aprendizado por reforço, o modelo melhorará continuamente a eficiência das decisões, com o objetivo de alcançar uma tecnologia de direção autônoma que supere a capacidade humana. Para apoiar esse desenvolvimento, a XPeng Motors acelerou a implantação de infraestrutura de IA desde 2023, tendo construído o primeiro cluster de computação de 10.000 placas de vídeo da indústria automobilística chinesa, com capacidade de computação de 10 EFLOPS. A utilização do cluster se mantém estável acima de 90%, com pico de eficiência superior a 98%.
A XPeng Motors denominou todo o processo, desde o treinamento em nuvem até a implantação em veículos, como "fábrica de modelos em nuvem", abrangendo etapas como pré-treinamento, pós-treinamento, destilação de modelos e adaptação a veículos. Atualmente, esta fábrica alcança uma média de uma iteração completa a cada 5 dias, com o volume de dados de treinamento de vídeo aumentando de 20 milhões de clips para a meta de 200 milhões de clips este ano. A equipe de desenvolvimento também criou modelos de base de vários tamanhos, sendo que o modelo de 72 bilhões de parâmetros (72B) possui 35 vezes mais parâmetros que os modelos VLA convencionais, marcando um avanço significativo na reserva de poder computacional para direção autônoma.
Em termos de caminho tecnológico, a XPeng Motors usa a "fábrica de modelos em nuvem" para fechar o ciclo de dados: o modelo de base é pré-treinado e aprimorado por aprendizado por reforço na nuvem, sendo então comprimido em uma versão leve para implantação em veículos. Esta arquitetura não apenas suporta a atualização inteligente de modelos existentes, mas também fornecerá capacidades básicas para produtos de ponta, como robôs de IA e carros voadores.
Fontes oficiais revelam que a XPeng Motors iniciou a construção de sua infraestrutura de IA (AI Infra) em 2024, tendo formado um sistema completo que abrange a coleta de dados, o treinamento de modelos e a implementação em cenários. Três resultados de estágios foram alcançados: a verificação da eficácia contínua da lei de escala em direção autônoma, a implementação do modelo base em veículos com capacidade computacional adicional e o início do treinamento do modelo de 72B parâmetros, além da construção de uma estrutura específica para aprendizado por reforço. No futuro, o Modelo de Base do Mundo XPeng será profundamente integrado ao ecossistema de IA, impulsionando a evolução conjunta de veículos inteligentes e tecnologia robótica.