Recentemente, a Zhipu lançou oficialmente seu novo modelo principal GLM-4.5, que é chamado de "modelo base projetado especificamente para aplicações de Agent", e atingiu o nível de SOTA (State Of The Art) dos modelos open source em raciocínio, geração de código e capacidade geral de agentes. O lançamento do GLM-4.5 marca a rápida progressão dos fabricantes de grandes modelos nacionais no campo do open source, e oferece aos desenvolvedores uma poderosa ferramenta.
O GLM-4.5 adota uma arquitetura de Mixture of Experts (MoE), com dois versões: o GLM-4.5 com um total de 355 bilhões de parâmetros e o GLM-4.5-Air com um total de 106 bilhões de parâmetros. Destaca-se que essas duas versões já estão disponíveis como open source nos plataformas Hugging Face e ModelScope, e seguem a licença MIT, sem obstáculos para uso comercial.
No aspecto de avaliação, a Zhipu escolheu 12 benchmarks representativos para testes, e os resultados mostraram que a pontuação média geral do GLM-4.5 está em segundo lugar entre os modelos globais, em primeiro lugar entre os modelos nacionais e também em primeiro lugar entre os modelos open source. Embora haja espaço de melhoria em comparação com outros modelos, como o Claude-4-Sonnet, o GLM-4.5 demonstra desempenho notável em confiabilidade na chamada de ferramentas e conclusão de tarefas.
Além disso, a Zhipu realizou uma série de testes de tarefas de desenvolvimento de programação conectando modelos como o Claude Code, comprovando a forte capacidade do GLM-4.5 em cenários reais. Por exemplo, basta digitar simplesmente "faça um site de busca do Google" e o GLM-4.5 gerará um mecanismo de busca útil. Além disso, o modelo também pode criar uma página interativa de Terra 3D, onde os usuários podem obter informações detalhadas clicando em locais.
Do ponto de vista técnico, embora o GLM-4.5 tenha apenas metade dos parâmetros do DeepSeek-R1 e um terço dos parâmetros do Kimi-K2, ele alcançou desempenho comparável graças à maior eficiência dos parâmetros. Seu processo de treinamento utilizou dados gerais de 15 trilhões de tokens para pré-treinamento, e depois foi treinado de forma específica em áreas como código e raciocínio.
Destaca-se que o preço da API do GLM-4.5 é bastante acessível, com entrada de apenas 0,8 yuans por milhão de tokens e saída de 2 yuans por milhão de tokens, com velocidade de geração máxima de até 100 tokens por segundo. Isso torna o GLM-4.5 competitivo no mercado.
A crescente estabilidade e inovação contínua da Zhipu no setor de IA fizeram dela uma forte candidata a ser a primeira das "Seis Pequenas Bestas da IA" a iniciar um IPO.