A empresa líder na área de inteligência artificial da China, Zhipu AI, novamente causou um grande impacto no setor. Segundo informações recentes do AIbase, a Zhipu AI oficialmente abriu o código fonte de sua nova versão do modelo de visão geral GLM-4.1V-Thinking. Este modelo de raciocínio multimodal com 9 bilhões de parâmetros, graças às suas excelentes performances e amplas aplicações, não apenas quebrou registros em várias avaliações autoritárias, mas também demonstrou uma força poderosa que é comparável ou até superior à de modelos com 72 bilhões de parâmetros. Abaixo estão as últimas notícias organizadas pelo AIbase, para que você compreenda melhor essa tecnologia revolucionária.

image.png

Introdução ao raciocínio baseado em cadeia de pensamento, desempenho significativamente melhorado

O GLM-4.1V-Thinking foi profundamente otimizado com base na arquitetura GLM-4V anterior da Zhipu AI, introduzindo uma mecanismo inovador de raciocínio baseado em cadeia de pensamento (Chain-of-Thought Reasoning). Esse mecanismo aumentou significativamente o desempenho do modelo nas tarefas cognitivas complexas, permitindo que ele processe de forma mais eficiente entradas multimodais, incluindo imagens, vídeos e documentos. De acordo com o AIbase, o modelo obteve os melhores resultados entre modelos com 1 bilhão de parâmetros em 23 das 28 avaliações autoritárias (como MMStar, MMBU-Pro, ChartQAPro, OSWorld, etc.), e em 18 delas superou ou igualou modelos com maior número de parâmetros, como o Qwen-2.5-VL72B, demonstrando sua impressionante capacidade de raciocínio.

Capacidades multimodais completas, impulsionando milhares de indústrias

O GLM-4.1V-Thinking suporta um comprimento máximo de contexto de até 64K e resolução de imagem de 4K, além de ter capacidade de lidar com tarefas complexas em cenários multilíngues, com suporte a chinês e inglês. Seja entendimento de vídeos longos, perguntas e respostas sobre imagens, resolução de problemas acadêmicos, reconhecimento de texto, interpretação de documentos, localização de imagens (Grounding), operações de agente GUI ou geração de código, esse modelo pode lidar com tudo com facilidade. Sua característica de código aberto reduz ainda mais a barreira de uso, podendo ser executado com uma única placa de vídeo 3090, e a licença gratuita para uso comercial oferece amplo espaço de aplicação para empresas e desenvolvedores. O AIbase acredita que essa combinação de flexibilidade e alto desempenho vai impulsionar significativamente a implementação da tecnologia de IA nas indústrias educacional, financeira e médica.

Estratégia de código aberto, liderando a competição global de IA

A Zhipu AI escolheu abrir completamente o código do GLM-4.1V-Thinking e disponibilizar os pesos do modelo e demonstrações através da plataforma Hugging Face, demonstrando seu compromisso em promover a difusão da tecnologia de IA. O AIbase observou que nos últimos anos a Zhipu AI tem feito movimentos frequentes no campo do código aberto, e os modelos da série GLM já foram baixados mais de 30 milhões de vezes ao redor do mundo, tornando-se uma parte importante da ecologia de IA da China. A abertura do GLM-4.1V-Thinking não apenas fornece aos desenvolvedores uma ferramenta de raciocínio multimodal de alto desempenho, mas também garante a flexibilidade para uso comercial por meio da licença MIT, reforçando ainda mais a competitividade da Zhipu AI no cenário global de IA.

Confronto direto com os modelos de topo mundial

Na comparação de desempenho, o GLM-4.1V-Thinking mostrou uma força impressionante. Com base nos dados de avaliação do AIbase, o modelo se saiu bem em várias tarefas complexas, especialmente em cenários de alta dificuldade como questões de ciências e engenharia e compreensão de documentos longos, onde algumas de suas performances superaram até o modelo GPT-4o da OpenAI. Essa evolução significativa indica que a Zhipu AI já está entre as principais figuras mundiais na área de raciocínio multimodal e está competindo diretamente com gigantes internacionais como a OpenAI e a Google.

Novo capítulo na ascensão da IA chinesa

Como uma das "Quatro Feras Novas" da IA da China, a Zhipu AI está redefinindo o cenário global de IA por meio de inovações tecnológicas contínuas e estratégias de ecologia aberta. O AIbase acredita que a divulgação do GLM-4.1V-Thinking não apenas reflete a força técnica da Zhipu AI, mas também é uma importante manifestação da indústria de IA da China no palco global. No futuro, à medida que mais desenvolvedores construírem aplicações inovadoras com base no GLM-4.1V-Thinking, a influência internacional da IA chinesa será ampliada ainda mais.

Conclusão