智谱AI开源模型GLM-4.7-Flash发布两周,在Hugging Face下载量突破100万。这款30B-A3B混合思考模型性能强劲,在SWE-bench Verified和τ²-Bench等测试中,综合表现超越gpt-oss-20b及Qwen3-30B-A3B-Thinking-2507,在同尺寸模型中领先。
腾讯混元团队开源混元图像3.0图生图模型,拥有800亿参数,采用混合专家架构,在全球影像编辑榜单中位列第七。其核心突破在于“先思考,后编辑”的多模态架构,成为当前全球最强的开源图生图模型。
腾讯混元发布图像3.0图生图模型,已在元宝助手和官网上线。该模型采用混合专家架构,参数量达800亿,能根据用户指令智能编辑图片,实现“会思考”的图像处理。
智谱AI开源最新“混合思考”模型GLM-4.4-Flash,采用30B-A3B MoE架构,总参数量300亿,实际激活约30亿参数。该模型在保持轻量化部署优势的同时,凭借卓越推理与编码能力,登顶同类规格模型性能榜首,成为30B级别中的“全能王者”。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
$2
$20
Baidu
128
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
jackcloudman
Qwen3-Next-80B-A3B-Thinking 是通义千问团队推出的新一代思考型大语言模型,采用创新的混合注意力机制和高稀疏MoE架构,在保持高效推理的同时具备强大的复杂推理能力,原生支持262K上下文长度。
DavidAU
这是一个基于Qwen3-Coder-30B-A3B-Instruct的混合专家模型,拥有540亿参数和100万上下文长度。模型通过三步合并和Brainstorm 40X优化,具备强大的编程能力和通用场景处理能力,特别集成了思考模块,能够在回答前进行深度推理。
unsloth
NVIDIA Nemotron Nano 9B v2 是 NVIDIA 开发的一款高性能大语言模型,采用 Mamba2-Transformer 混合架构,支持多语言推理和聊天任务,在多个基准测试中表现优异,特别支持运行时'思考'预算控制功能。
DeepSeek-V3.1是DeepSeek-AI开发的大语言模型,是DeepSeek-V3的升级版本。该模型支持混合思考模式和非思考模式,在工具调用、代码生成、数学推理等方面表现出色,支持128K上下文长度。
nvidia
NVIDIA-Nemotron-Nano-9B-v2是NVIDIA从头训练的大语言模型,专为推理和非推理任务设计。采用Mamba2-Transformer混合架构,支持多语言处理,具备可控推理能力,允许用户指定思考预算,在商业应用和AI代理系统中表现出色。
cpatonn
Qwen3-30B-A3B-Instruct-2507是阿里云推出的305亿参数混合专家模型,采用非思考模式,在指令遵循、逻辑推理、文本理解、数学科学、编码和工具使用等方面表现优异,支持262K长上下文和多语言处理。
Qwen3-235B-A22B-Thinking-2507是一款强大的混合专家语言模型,在知识推理、数学计算、科学分析、编程等多个领域表现出色。该模型具有235B总参数和22B激活参数,支持256K长上下文理解,在开源思考模型中达到了最先进的性能水平。
QuixiAI
Qwen3-30B-A3B-AWQ是基于Qwen3-30B-A3B模型的AWQ量化版本,是通义系列最新一代大语言模型。该模型采用专家混合(MoE)架构,支持思考模式和非思考模式的双模式切换,在推理、指令遵循、智能体能力和多语言支持方面表现优异。
maldv
基于Qwen系列模型的标准化去噪傅里叶插值混合模型,以高质量回答和情感共鸣著称的思考型大语言模型