A equipe técnica da Zhipu anunciou a disponibilização de código aberto dos modelos GLM (General Language Model) da série 32B e 9B, e lançou oficialmente a nova plataforma de experiência interativa Z.ai. Esta série de modelos inclui modelos base, modelos de inferência e modelos de ruminação, todos sob a licença MIT, oferecendo aos desenvolvedores grande liberdade de uso e desenvolvimento, podendo ser usados gratuitamente para fins comerciais e distribuídos livremente.
O modelo base 32B GLM-4-32B-0414, disponibilizado desta vez, possui 32 bilhões de parâmetros, pré-treinado com 15T de dados de alta qualidade, incluindo dados sintéticos de raciocínio. Na fase de pós-treinamento, por meio de técnicas como rejeição de amostragem e aprendizado por reforço, o desempenho do modelo em tarefas como seguimento de instruções, geração de código de engenharia e chamadas de funções foi significativamente aprimorado, com alguns indicadores de benchmark se aproximando ou mesmo superando os níveis de modelos maiores, como GPT-4o e DeepSeek-V3-0324 (671B). Além disso, o GLM-4-32B-0414 aprimorou ainda mais a capacidade de geração de código, podendo processar e gerar códigos de arquivos únicos mais complexos. O modo de conversa do Z.ai possui um recurso de visualização embutido, permitindo a visualização de HTML e SVG gerados, facilitando a avaliação dos resultados gerados e a otimização iterativa.

O modelo de inferência GLM-Z1-32B-0414, baseado no GLM-4-32B-0414, utiliza estratégias de inicialização a frio e aprendizado por reforço expandido, e foi treinado profundamente para otimizar tarefas-chave como matemática, código e lógica. O desempenho deste modelo em algumas tarefas já é comparável ao do DeepSeek-R1 com 671B de parâmetros, demonstrando uma forte capacidade de raciocínio matemático e suportando a resolução de tarefas mais amplas e complexas. Vale mencionar que a velocidade de inferência testada do GLM-Z1-32B-0414 pode atingir 200 Tokens/segundo, sendo o mais rápido entre os modelos comerciais domésticos atualmente, com um preço de apenas 1/30 do DeepSeek-R1.
O modelo GLM-Z1-9B-0414 de 9B de parâmetros utiliza a mesma série de tecnologias mencionadas acima. Apesar de ter menos parâmetros, ele ainda apresenta excelente desempenho em raciocínio matemático e tarefas gerais, estando entre os melhores modelos de código aberto de mesmo tamanho. Em cenários com recursos limitados, este modelo equilibra bem eficiência e efeito, oferecendo uma opção robusta para usuários que precisam de implantação leve.
O modelo de ruminação GLM-Z1-Rumination-32B-0414 representa a próxima etapa da exploração da Zhipu em relação à IAG (Inteligência Artificial Geral). Diferentemente dos modelos de inferência comuns, o modelo de ruminação resolve problemas altamente abertos e complexos por meio de etapas de reflexão mais profundas. Sua inovação principal reside na capacidade de integrar ferramentas de busca para lidar com tarefas complexas durante o processo de reflexão profunda, e no uso de vários mecanismos de recompensa baseados em regras para orientar e expandir o treinamento de aprendizado por reforço de ponta a ponta. Este modelo suporta um ciclo completo de pesquisa de "formular perguntas independentemente - pesquisar informações - construir análises - concluir tarefas", melhorando significativamente sua capacidade em redação de pesquisas e tarefas de busca complexas.

Além da disponibilização de código aberto dos modelos, os modelos base e de inferência também foram lançados simultaneamente na plataforma aberta MaaS da Zhipu (bigmodel.cn), fornecendo serviços de API para empresas e desenvolvedores. Os modelos base lançados oferecem duas versões: GLM-4-Air-250414 e GLM-4-Flash-250414, sendo a última totalmente gratuita. Os modelos de inferência lançados são divididos em três versões, atendendo às diferentes necessidades de cenário: GLM-Z1-AirX (versão ultrarrápida), posicionado como o modelo de inferência mais rápido da China, com velocidade de inferência de 200 tokens/segundo, 8 vezes mais rápido que o convencional; GLM-Z1-Air (versão custo-benefício), com preço de apenas 1/30 do DeepSeek-R1, adequado para cenários de alta frequência de chamadas; GLM-Z1-Flash (versão gratuita), com uso gratuito, objetivando reduzir ainda mais a barreira de uso do modelo.
Simultaneamente, a Zhipu ativou o novo domínio Z.ai. Esta plataforma integra os três tipos de modelos GLM de 32B (base, inferência e ruminação), servindo como entrada de experiência interativa para os modelos mais recentes da Zhipu. Atualmente, três modelos de código aberto já estão disponíveis na plataforma, onde os usuários podem experimentar gratuitamente os poderosos recursos desses modelos.




