Na palestra temática do Huawei Developer Conference (HDC2025), realizada nesta tarde, Zhang Ping'an, diretor executivo sênior da Huawei e CEO da Huawei Cloud, anunciou oficialmente o lançamento do modelo Pangu 5.5, marcando uma atualização abrangente nas cinco principais áreas de modelos básicos: processamento de linguagem natural (NLP), visão computacional (CV), multimodalidade, previsão e cálculo científico.

No campo do modelo NLP Pangu, o novo modelo de pensamento profundo de 718B, que é um modelo MoE composto por 256 especialistas, apresenta uma melhoria significativa em capacidades como raciocínio em conhecimento, chamada de ferramentas e matemática, mantendo-se à frente da indústria. O modelo Pangu foi treinado usando toda a pilha de software e hardware da Ascend Cloud, demonstrando a capacidade da arquitetura Ascend de criar modelos de primeira linha mundial. Além disso, o Pangu 5.5 recebeu melhorias em características como sequências eficientes longas, baixa alucinação, pensamento rápido e lento combinados, e agentes. Com a tecnologia de pensamento rápido e lento adaptativo unificado, o modelo pode automaticamente alternar entre modos de pensamento dependendo da dificuldade da questão, aumentando a eficiência geral de inferência em 8 vezes. O estudo em profundidade Pangu DeepDiver, utilizando técnicas como síntese de problemas de longa cadeia e recompensa progressiva, demonstrou uma execução eficiente em aplicativos como pesquisa na web e perguntas comuns, como responder perguntas complexas com mais de 10 saltos em menos de 5 minutos ou gerar relatórios de pesquisa profissionais com mais de 10 mil palavras, aumentando significativamente a eficiência.

No campo do modelo de previsão Pangu, adotou uma arquitetura pré-treinada inovadora chamada triplet transformer para codificar e processar dados de diferentes setores de forma unificada, aumentando significativamente a precisão de previsão e a generalização transindustrial e transcontextual.
No campo do modelo de cálculo científico Pangu, a Huawei Cloud continua aprofundando sua integração com aplicações científicas. A administração meteorológica de Shenzhen baseou-se no Pangu para atualizar o "Zhi Ji" grande modelo, implementando previsões de reunião de IA, refletindo de forma mais intuitiva as possibilidades de evolução do sistema meteorológico, reduzindo os erros nas previsões. A administração meteorológica de Chongqing criou o modelo meteorológico "Tian Zi - 12h", focado nas características de precipitação da região Chengdu-Chongqing, melhorando a capacidade de previsão e alerta de tempo adverso durante o dia. A Shenzhen Energy utilizou o Pangu para prever a produção de energia eólica, solar e hidrelétrica a curto e médio prazo, reduzindo fenômenos de desperdício de energia e melhorando a eficiência no desenvolvimento de energia.
No campo do modelo de visão computacional (CV) Pangu, a Huawei Cloud lançou um modelo visual de 300 bilhões de parâmetros com nova arquitetura MoE, sendo o maior modelo visual atualmente disponível na indústria, oferecendo suporte completo para percepção, análise e tomada de decisão em múltiplos domínios e visão ampla. Além disso, o modelo CV Pangu construiu uma biblioteca de amostras raras de defeitos visuais em cenários industriais através de modelos geradores transcendentais, aumentando significativamente a variedade e a precisão dos tipos de identificação em cenários de negócios.
No campo do modelo multimodalidade Pangu, foi lançado o modelo de mundo Pangu, que cria um espaço físico digital para treinar veículos autônomos e máquinas inteligentes corporificadas, permitindo otimizações contínuas e iterativas. No campo da condução autônoma, o modelo de mundo Pangu pode gerar grandes quantidades de dados de treinamento sem depender de coleta de estrada cara, proporcionando apoio significativo ao desenvolvimento da condução autônoma.
Além disso, após o lançamento do modelo Pangu 5.5 da Huawei Cloud, foram introduzidas cinco novas versões com capacidade de pensamento profundo de modelos de linguagem natural voltados para diferentes setores. Esses cinco modelos incluem o Thinking Pangu Medical, Thinking Pangu Finance, Thinking Pangu Government, Thinking Pangu Industry e Thinking Pangu Auto, destinados a fornecer soluções de processamento de linguagem natural mais especializadas e inteligentes para diferentes setores. Informações indicam que esses cinco modelos estarão disponíveis oficialmente em breve, trazendo uma experiência mais eficiente e precisa de processamento de linguagem natural para cada setor.