智谱AI因GLM-4.7上线后用户激增导致算力紧张,宣布对GLM Coding Plan限量发售以保障存量用户体验。高峰期并发限流,显示国产大模型需求旺盛。
三七互娱从游戏跨界AI投资,布局智谱AI、月之暗面等前沿科技公司,旨在以AI技术提升游戏行业生产力。随着智谱AI上市成为“全球大模型第一股”,市值突破578亿港元,彰显其科技转型的初步成效。
智谱AI开源最新“混合思考”模型GLM-4.4-Flash,采用30B-A3B MoE架构,总参数量300亿,实际激活约30亿参数。该模型在保持轻量化部署优势的同时,凭借卓越推理与编码能力,登顶同类规格模型性能榜首,成为30B级别中的“全能王者”。
韩国政府斥巨资推动的“本土大模型竞赛”陷入争议。五家决赛入围企业中,至少三家被指使用了中国和美国公司的开源代码,包括智谱AI、阿里巴巴、OpenAI等,引发对“国产AI是否真正自主”的激烈辩论。该项目旨在三年内打造纯韩国技术大模型,但代码依赖问题使其目标受到质疑。
提升网络浏览体验的AI助手
几行代码接入大模型
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Anthropic
$7
$35
200
Alibaba
-
Bytedance
Xai
$1.4
$10.5
256
Baidu
Tencent
$2
$1.75
$14
400
$105
$525
bullpoint
GLM-4.6-AWQ是对智谱AI的GLM-4.6(357B MoE)进行高性能AWQ量化的模型,专为vLLM推理进行了优化,能有效提升生产部署的吞吐量。该模型采用4位量化技术,在保持高精度的同时显著减少显存占用。
unsloth
GLM-4.6是智谱AI推出的新一代文本生成模型,相比GLM-4.5在多个方面有显著改进,包括更长的上下文窗口、更优的编码性能和更强的推理能力。该模型在多个公开基准测试中表现出色,与国内外领先模型相比具有竞争优势。
GLM-4.6是智谱AI开发的新一代大语言模型,相比GLM-4.5在上下文处理、编码能力和推理性能方面有显著提升。该模型支持200K上下文长度,在多个公开基准测试中表现出色,特别在代码生成、推理和代理任务方面具有竞争优势。
zai-org
GLM-4.6是智谱AI推出的新一代文本生成模型,相比GLM-4.5在上下文处理、编码性能、推理能力等方面实现显著提升,支持200K上下文长度,具备更强的智能体能力和精致的写作能力。
GLM-4.6-FP8是智谱AI推出的新一代文本生成模型,相比GLM-4.5在多个关键方面有显著改进。该模型具有更长的上下文窗口、卓越的编码性能、高级推理能力和更强大的智能体功能,能够处理更复杂的任务。
Jackmin108
GLM-4.5-Air是智谱AI推出的适用于智能体的基础模型,采用紧凑设计,统一了推理、编码和智能体能力,能满足智能体应用的复杂需求。该模型参数量适中且效率优越,已开源多种版本,可用于商业和二次开发。
mlx-community
基于智谱AI GLM-4.5-Air模型转换的3位深度量化权重(Deep Weight Quantization)版本,专为MLX框架优化,在保持较高性能的同时显著减少模型大小和推理资源需求
cpatonn
GLM-4.5V-AWQ-4bit是基于智谱AI下一代旗舰文本基础模型构建的量化版本多模态模型,通过AWQ-4bit量化技术优化,在保持优异性能的同时显著降低计算资源需求。该模型在42个公开视觉语言基准测试中达到同规模模型的SOTA性能,具备强大的视觉推理能力。
GLM-4.5-Air-2bit是基于智谱AI的GLM-4.5-Air模型转换而来的2位量化版本,采用MLX格式优化,可在Apple芯片设备上高效运行。该模型支持文本生成任务,具有轻量级和高效率的特点。
GLM-4.5-Air-6bit是基于智谱AI的GLM-4.5-Air模型转换而来的6位量化版本,专为MLX框架优化,提供高效的大语言模型推理能力。
GLM-4.5-Air-8bit是基于智谱AI的GLM-4.5-Air模型转换而来的8位量化版本,专门为MLX框架优化。该模型保持了原版强大的自然语言处理能力,同时通过量化技术减少了内存占用和计算需求,适合在Apple Silicon设备上高效运行。
GLM-4.1V-9B-Base是智谱AI开发的开源视觉语言基础模型,拥有90亿参数,专注于多模态推理能力,支持中英双语,处理高达4K分辨率的图像和64K上下文长度。
GLM-4-Z1-9B-0414是智谱AI推出的新一代90亿参数开源大语言模型,具有强大的文本生成和推理能力。该模型在数学推理和通用任务方面表现出色,在资源受限场景下实现了效率与效果的出色平衡,支持友好的本地部署。
GLM-4-9B-0414是智谱AI推出的90亿参数大语言模型,在文本生成领域表现优异。该模型在15T高质量数据上进行预训练,具备强大的文本生成能力,可应用于代码编写、故事创作、报告生成等多种场景,在效率和效果之间取得了出色平衡。
THUDM
GLM-4-9B是智谱AI推出的GLM-4系列最新一代预训练模型的开源版本,在语义、数学、推理、代码和知识等数据集评估中表现出色,具备多语言支持等先进特性。
GLM-4-9B是智谱AI推出的GLM-4系列最新一代预训练模型的开源版本,在语义、数学、推理、代码和知识等数据集评估中表现出色,支持多语言和多种高级特性,包括网页浏览、代码执行、自定义工具调用和长文本推理等功能。
GLM-Edge-4B-Chat是智谱AI开发的一个40亿参数的中英双语对话模型,专门针对边缘设备优化,支持高效的文本生成任务。该模型基于Transformer架构,具有轻量化、高效率的特点,适合在资源受限的环境中部署。
CogVideoX1.5-5B 是智谱AI开源的文本到视频生成模型,能够根据英文文本描述生成高质量视频。该模型支持生成1360×768分辨率、最高81帧(5秒)的视频,在视频创作领域具有广泛应用价值。
GLM-4-9B-Chat是智谱AI推出的GLM-4系列最新一代预训练模型的开源版本,在语义、数学、推理、代码和知识等数据集评估中表现出色,支持多轮对话、网页浏览、代码执行等先进特性,还支持多语言及长上下文推理。
GLM-4-9B是智谱AI推出的GLM-4系列最新一代预训练模型的开源版本,具备卓越的语义、数学、推理、代码和知识能力。
一个基于智谱API的MCP服务演示项目,展示了如何使用Model Context Protocol快速开发AI应用服务。
这是一个基于MCP协议的项目,集成了智谱AI和腾讯地图API,提供天气查询、地理编码和网络搜索等功能,支持命令行和Web界面两种交互方式。