Information

Latest AI News

Explore AI Frontiers, Master Industry Trends

AI Daily Brief

Your Daily AI Brief - Never Miss What's Next

Information

AI Product Finder

Smart Product Discovery - Comprehensive Market Intelligence

AI Product Rankings

AI Product Power Rankings - Performance, Buzz & Trends

AI Product Submit

Submit Your AI Product - Amplify Reach & Drive Growth

Tools

AI Tools Directory

Discover The Best AI Websites & Tools

Tools

GEO Brand Visibility

All-in-One GEO Brand Insights Platform

AI Visibility Audit

Quickly check how your brand is perceived and presented in AI-powered search results.

AI Search Visibility Checker

Detect brand's visibility on AI platforms

GEO Ranking Monitor

Batch queries & scheduled GEO ranking tracking

AI Conversation Insight

Discover trending questions users ask AI to guide content strategy

GEO Promotion Link Detection

Quickly evaluate the citation of promotion articles on AI platforms

Service

GEO Ranking Optimization System

Own your own GEO system and become a professional GEO optimization service provider.

GEO Ranking Optimization

Achieve Dominant Visibility in AI Search for Your Business or Brand with GEO Services

Information

MCP Servers

Discover Popular AI-MCP Services - Find Your Perfect Match Instantly

MCP Client

Easy MCP Client Integration - Access Powerful AI Capabilities

MCP Case Tutorials

Master MCP Usage - From Beginner to Expert

MCP Ranking

Top MCP Service Performance Rankings - Find Your Best Choice

MCP Service Submission

Publish & Promote Your MCP Services

Tools

MCP Playground

Test MCP Services Freely - Quick Online Experience

MCP Inspector

Quick MCP Service Testing - Fast Deployment

Information

LLM API Hub

One-stop integration for all major LLM APIs.

AI Models Finder

Comprehensive AI Models Collection for All Your Development & Research Needs

Model Providers

Discover Trusted AI Model Partners - Guaranteed Reliable Support

LLM Leaderboard

AI LLM Power Rankings - Performance, Buzz & Trends

Tools

LLM API Proxy Checker

Choose reliable LLM API proxies with our 5-dimension test

Compare LLMs

Multi-Dimensional Large Model Comparison - Find Your Perfect Match

LLM Cost Calculator

Calculate AI Model Costs Accurately - Optimize Your Budget

LLM Arena

Multi-Model Real-Time Evaluation & Quick Output Comparison

AI Model Compatibility Checker

Free PC Hardware Test for DeepSeek & Llama

AI Deployment Calculator

Enter Your Large Model Computing Requirements for Instant GPU, Memory & Server Configuration Recommendations

智谱AI lança novo domínio Z.ai e código aberto para modelos GLM da série 32B/9B

AIbase基地

Publicado emNotícias e Informações de IA · 7 minutos de leitura · Apr 15, 2025

A equipe técnica da Zhipu anunciou a disponibilização de código aberto dos modelos GLM (General Language Model) da série 32B e 9B, e lançou oficialmente a nova plataforma de experiência interativa Z.ai. Esta série de modelos inclui modelos base, modelos de inferência e modelos de ruminação, todos sob a licença MIT, oferecendo aos desenvolvedores grande liberdade de uso e desenvolvimento, podendo ser usados gratuitamente para fins comerciais e distribuídos livremente.

O modelo base 32B GLM-4-32B-0414, disponibilizado desta vez, possui 32 bilhões de parâmetros, pré-treinado com 15T de dados de alta qualidade, incluindo dados sintéticos de raciocínio. Na fase de pós-treinamento, por meio de técnicas como rejeição de amostragem e aprendizado por reforço, o desempenho do modelo em tarefas como seguimento de instruções, geração de código de engenharia e chamadas de funções foi significativamente aprimorado, com alguns indicadores de benchmark se aproximando ou mesmo superando os níveis de modelos maiores, como GPT-4o e DeepSeek-V3-0324 (671B). Além disso, o GLM-4-32B-0414 aprimorou ainda mais a capacidade de geração de código, podendo processar e gerar códigos de arquivos únicos mais complexos. O modo de conversa do Z.ai possui um recurso de visualização embutido, permitindo a visualização de HTML e SVG gerados, facilitando a avaliação dos resultados gerados e a otimização iterativa.

微信截图_20250415090652.png

O modelo de inferência GLM-Z1-32B-0414, baseado no GLM-4-32B-0414, utiliza estratégias de inicialização a frio e aprendizado por reforço expandido, e foi treinado profundamente para otimizar tarefas-chave como matemática, código e lógica. O desempenho deste modelo em algumas tarefas já é comparável ao do DeepSeek-R1 com 671B de parâmetros, demonstrando uma forte capacidade de raciocínio matemático e suportando a resolução de tarefas mais amplas e complexas. Vale mencionar que a velocidade de inferência testada do GLM-Z1-32B-0414 pode atingir 200 Tokens/segundo, sendo o mais rápido entre os modelos comerciais domésticos atualmente, com um preço de apenas 1/30 do DeepSeek-R1.

O modelo GLM-Z1-9B-0414 de 9B de parâmetros utiliza a mesma série de tecnologias mencionadas acima. Apesar de ter menos parâmetros, ele ainda apresenta excelente desempenho em raciocínio matemático e tarefas gerais, estando entre os melhores modelos de código aberto de mesmo tamanho. Em cenários com recursos limitados, este modelo equilibra bem eficiência e efeito, oferecendo uma opção robusta para usuários que precisam de implantação leve.

O modelo de ruminação GLM-Z1-Rumination-32B-0414 representa a próxima etapa da exploração da Zhipu em relação à IAG (Inteligência Artificial Geral). Diferentemente dos modelos de inferência comuns, o modelo de ruminação resolve problemas altamente abertos e complexos por meio de etapas de reflexão mais profundas. Sua inovação principal reside na capacidade de integrar ferramentas de busca para lidar com tarefas complexas durante o processo de reflexão profunda, e no uso de vários mecanismos de recompensa baseados em regras para orientar e expandir o treinamento de aprendizado por reforço de ponta a ponta. Este modelo suporta um ciclo completo de pesquisa de "formular perguntas independentemente - pesquisar informações - construir análises - concluir tarefas", melhorando significativamente sua capacidade em redação de pesquisas e tarefas de busca complexas.

微信截图_20250415090630.png

Além da disponibilização de código aberto dos modelos, os modelos base e de inferência também foram lançados simultaneamente na plataforma aberta MaaS da Zhipu (bigmodel.cn), fornecendo serviços de API para empresas e desenvolvedores. Os modelos base lançados oferecem duas versões: GLM-4-Air-250414 e GLM-4-Flash-250414, sendo a última totalmente gratuita. Os modelos de inferência lançados são divididos em três versões, atendendo às diferentes necessidades de cenário: GLM-Z1-AirX (versão ultrarrápida), posicionado como o modelo de inferência mais rápido da China, com velocidade de inferência de 200 tokens/segundo, 8 vezes mais rápido que o convencional; GLM-Z1-Air (versão custo-benefício), com preço de apenas 1/30 do DeepSeek-R1, adequado para cenários de alta frequência de chamadas; GLM-Z1-Flash (versão gratuita), com uso gratuito, objetivando reduzir ainda mais a barreira de uso do modelo.

Simultaneamente, a Zhipu ativou o novo domínio Z.ai. Esta plataforma integra os três tipos de modelos GLM de 32B (base, inferência e ruminação), servindo como entrada de experiência interativa para os modelos mais recentes da Zhipu. Atualmente, três modelos de código aberto já estão disponíveis na plataforma, onde os usuários podem experimentar gratuitamente os poderosos recursos desses modelos.

GLM-4-32B-0414 Z.ai Modelo de linguagem grande Modelo de código aberto

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

20 mil dólares para um substituto de tarefas domésticas? O robô humanoide 1X Neo, financiado pela OpenAI, começa a pré-venda e entra nas casas norte-americanas no próximo ano

A empresa norueguesa de robôs 1X lança o primeiro robô humanoide para uso doméstico, o Neo, com preço de 20 mil dólares e taxa de assinatura mensal de 499 dólares. Este robô de 1,68 metros foi projetado especialmente para tarefas domésticas como lavar pratos e organizar, utilizando um modelo de inteligência artificial combinada com suporte remoto humano, necessitando de apoio externo para completar tarefas complexas.

Oct 29, 2025

570

Hunyuan lança o primeiro podcast de IA interativo no país, os usuários podem fazer perguntas a qualquer momento

Tencent Hunyuan lançou o primeiro podcast interativo com IA da China, permitindo que os usuários façam perguntas em tempo real por voz ou texto aos apresentadores e convidados, superando as limitações unidirecionais dos podcasts tradicionais e melhorando a interatividade e eficiência na obtenção de informações.....

Oct 29, 2025

350

Amazon Cloud planeja investir mais 5 bilhões de dólares na Coreia do Sul para impulsionar a construção de centrais de dados de inteligência artificial

A AWS da Amazon anunciou que planeja investir mais 5 bilhões de dólares na Coreia do Sul nos próximos seis anos para expandir centrais de dados de inteligência artificial, colaborando com o Grupo SK para construir uma grande instalação em Ulsan. O investimento total na Coreia chegará a 12,6 bilhões de dólares, destacando a importância estratégica do mercado sul-coreano.

Oct 29, 2025

310

Diário de IA: Douyu lança sistema automático de dublagem em grupo; Adobe Firefly Image 5 atualizado significativamente; SoulX-Podcast, modelo de voz da Soul, é lançado

Sistema de áudio AI da Doubao gera dramas com múltiplos narradores diretamente de textos, precisão de 98% na identificação de personagens, revolucionando produção de conteúdo sonoro.....

Oct 29, 2025

510

Qualcomm entra no mercado de data centers! Lança os chips AI200/AI250 com objetivo de enfrentar a NVIDIA, ações subiram mais de 20% em um dia

A Qualcomm lançou dois chips de inferência de IA em nuvem, o AI200 e o AI250, que devem ser comercializados em 2026 e 2027, marcando uma transição da fabricação de chips para terminais para uma infraestrutura completa de IA. A notícia impulsionou o aumento das ações em mais de 20% em um único dia, sendo o maior aumento desde 2019. Diferente da abordagem abrangente da NVIDIA, a Qualcomm está focada no mercado de inferência de grandes modelos, destacando vantagens em eficiência energética e custo.

Oct 29, 2025

290

Magic Leap anuncia parceria reatada com o Google para desenvolver protótipos de óculos AR da próxima geração

Em 29 de outubro, a Magic Leap e o Google anunciaram uma nova parceria na conferência de investimento no futuro de Riad, para desenvolver protótipos de óculos de realidade aumentada, promovendo o avanço da tecnologia de realidade aumentada. Ross Rosenburg, líder da Magic Leap, disse que a empresa está se transformando de pioneira em realidade aumentada para parceira de ecossistema, utilizando sua experiência em inovações em óptica e exibição para alcançar uma nova fase de sua visão.

Oct 29, 2025

310

Tsinghua e Kuaishou lançam um novo modelo de difusão SVG, eficiência de treinamento aumenta 6200%

A Universidade de Tsinghua e a equipe Kuaishou Ke Ling lançaram o modelo SVG, substituindo o VAE, resolvendo o problema de entrelaçamento semântico, aumentando a eficiência de treinamento em 6200%, velocidade de geração aumenta em 3500%, marcando o início do fim do VAE na área de geração de imagens.

Oct 29, 2025

320

NVIDIA lança design revolucionário para centro de dados de IA, impulsionando cálculo de alto desempenho

Na conferência GTC 2025, a NVIDIA apresentou o projeto "Omniverse DSX Blueprint", um design especialmente desenvolvido para centros de dados de IA com capacidade de giga瓦, conhecido como "Fábrica de IA". Este projeto baseia-se no framework Omniverse e suporta diferentes escalas, desde 1 bilhão até 10 bilhões de watts, com o objetivo de treinar e executar eficientemente grandes modelos de IA, atendendo à crescente demanda por computação de IA, sendo uma importante evolução na infraestrutura de inteligência artificial.

Oct 29, 2025

350

Vice-presidente do Douyin, Li Liang, diz que a IA torna a difamação mais fácil e a plataforma está usando agentes inteligentes para combater falsas notícias

O vice-presidente do Douyin, Li Liang, enfatizou que a IA pode ser facilmente usada para criar notícias falsas, e a plataforma está ativamente utilizando tecnologia de IA para combater difamações, desenvolvendo um 'agente de combate às falsas notícias'. Busca rápida em toda a rede é uma das prioridades este ano.

Oct 29, 2025

360

Revolução dos podcasts com IA! Doubao lança sistema automático de voz múltipla 98% de precisão na identificação de personagens, rivalizando com dramas de rádio profissionais

A equipe de voz do Doubao lançou uma solução para "podcasts de IA com múltiplas vozes", realizando a produção totalmente automática desde o texto de um romance até o produto final de drama de rádio. Não é necessário dublagem, edição ou intervenção humana, reduzindo custos e aumentando a eficiência, com resultados próximos aos padrões profissionais, atingindo uma taxa de identificação de personagens de 98%.

Oct 29, 2025

310