智谱AI开源最新“混合思考”模型GLM-4.4-Flash,采用30B-A3B MoE架构,总参数量300亿,实际激活约30亿参数。该模型在保持轻量化部署优势的同时,凭借卓越推理与编码能力,登顶同类规格模型性能榜首,成为30B级别中的“全能王者”。
Chatglm
-
输入tokens/百万
输出tokens/百万
128
上下文长度