Las empresas líderes en el campo de la inteligencia artificial en China, Zhipu AI, vuelven a generar un gran revuelo en la industria. Según información reciente de AIbase, Zhipu AI ha anunciado oficialmente el lanzamiento abierto de su nueva generación de modelos visuales multivía GLM-4.1V-Thinking. Este modelo de razonamiento multimodal con 900 millones de parámetros, gracias a su rendimiento excepcional y amplias aplicaciones, no solo ha establecido nuevos récords en varias evaluaciones autorizadas, sino que también ha demostrado una fuerza poderosa comparable o incluso superior a modelos de 7.200 millones de parámetros. A continuación, AIbase presenta las últimas noticias, para que conozca profundamente esta tecnología revolucionaria.
Introducción al razonamiento por cadenas de pensamiento, mejorando significativamente el rendimiento
GLM-4.1V-Thinking se basa en la arquitectura anterior de Zhipu AI, GLM-4V, y ha sido optimizado profundamente, introduciendo una mecanismo innovador de razonamiento por cadenas de pensamiento (Chain-of-Thought Reasoning). Este mecanismo mejora significativamente el desempeño del modelo en tareas cognitivas complejas, permitiéndole procesar de manera más eficiente entradas multimodales, como imágenes, videos y documentos. Según información de AIbase, el modelo alcanzó los mejores resultados de modelos con 1.000 millones de parámetros en 23 de 28 evaluaciones autorizadas (como MMStar, MMMU-Pro, ChartQAPro, OSWorld, etc.), y en 18 de ellas superó o igualó al modelo Qwen-2.5-VL72B, que tiene un mayor número de parámetros, demostrando así una sorprendente capacidad de razonamiento.
Capacidad multimodal completa, impulsando múltiples industrias
GLM-4.1V-Thinking admite una longitud de contexto de hasta 64K y una resolución de imagen de 4K, además de tener capacidad bilingüe en chino y español, lo que le permite manejar tareas complejas en escenarios multilingües sin problemas. Ya sea comprender videos largos, responder preguntas sobre imágenes, resolver problemas académicos, reconocer texto, interpretar documentos, localizar imágenes (Grounding), operar mediante agentes GUI o generar código, este modelo puede manejarlos con facilidad. Su característica de código abierto reduce aún más la barrera de uso, ya que puede ejecutarse con una sola tarjeta gráfica 3090, y la licencia gratuita para uso comercial proporciona amplios espacios de aplicación para empresas y desarrolladores. AIbase considera que la combinación de flexibilidad y alto rendimiento de este modelo impulsará enormemente la implementación de la tecnología de IA en industrias como educación, finanzas y salud.
Estrategia de código abierto, liderando la competencia global de IA
Zhipu AI ha decidido hacer completamente abierto GLM-4.1V-Thinking y proporcionar pesos del modelo y demostraciones a través de la plataforma Hugging Face, demostrando su determinación de promover la difusión de la tecnología de IA. AIbase observa que Zhipu AI ha estado activo en el ámbito del código abierto en los últimos años, y los modelos de la serie GLM han tenido más de 30 millones de descargas globales, convirtiéndose en una parte importante de la ecosistema de IA china. El lanzamiento abierto de GLM-4.1V-Thinking no solo ofrece a los desarrolladores una herramienta de razonamiento multimodal de alto rendimiento, sino que también garantiza la flexibilidad para su uso comercial mediante la licencia MIT, reforzando aún más la competitividad de Zhipu AI en el ámbito global de la IA.
Enfrentamiento directo con los modelos más destacados del mundo
En comparación de rendimiento, GLM-4.1V-Thinking muestra una fuerza notable. Según datos de evaluación recopilados por AIbase, este modelo se destaca en muchas tareas complejas, especialmente en escenarios de alta dificultad como problemas de ciencias y matemáticas, y comprensión de documentos largos, donde algunas de sus capacidades incluso superan al modelo de OpenAI GPT-4o. Esta mejora significativa indica que Zhipu AI ya está entre los líderes mundiales en el campo del razonamiento multimodal, enfrentándose directamente a gigantes internacionales como OpenAI y Google.
Una nueva era para la IA china
Como uno de los "cuatro grandes" en el campo de la IA china, Zhipu AI está redefiniendo el paisaje global de la IA mediante la innovación tecnológica continua y una estrategia de ecosistema abierta. AIbase considera que el lanzamiento de GLM-4.1V-Thinking no solo refleja la fuerza técnica de Zhipu AI, sino que también es un importante anuncio del sector de la IA china en el escenario internacional. En el futuro, a medida que más desarrolladores construyan aplicaciones innovadoras basadas en GLM-4.1V-Thinking, la influencia internacional de la IA china aumentará aún más.
Conclusión