智谱AI开源模型GLM-4.7-Flash发布两周,在Hugging Face下载量突破100万。这款30B-A3B混合思考模型性能强劲,在SWE-bench Verified和τ²-Bench等测试中,综合表现超越gpt-oss-20b及Qwen3-30B-A3B-Thinking-2507,在同尺寸模型中领先。
智谱联合华为开源图像生成模型GLM-Image,这是首个在国产芯片上完成全流程训练的SOTA多模态模型。其创新采用“自回归+扩散解码器”混合架构,实现了图像生成与语言模型的深度融合,在知识密集型任务中表现出色,能精准理解全局指令。
智谱AI与华为联合开源新一代图像生成大模型GLM-Image,性能达国际领先水平。该模型全程基于国产昇腾AI芯片与昇思框架构建,从数据处理到推理全流程实现国产化,摆脱对国外软硬件的依赖,验证了国产技术支撑尖端AI研发的能力。
国产大模型MiniMax开源M2.1,以100亿参数稀疏架构在多语言编程、代码生成与工具调用上实现突破,在权威基准测试中超越谷歌、Anthropic等闭源旗舰模型,标志着开源编码模型性能进入新阶段。
B站开源的SOTA动画视频生成模型,支持多种二次元风格视频一键生成。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
XiaomiMiMo
MiMo Audio是一款基于大规模预训练的音频语言模型,在语音智能和音频理解基准测试中取得了开源模型的SOTA性能。该模型展现出强大的少样本学习能力,能够泛化到训练数据中未包含的任务,支持语音转换、风格迁移和语音编辑等多种音频任务。
JetLM
SDAR是一种新型大语言模型,集成了自回归和离散扩散建模策略,结合了AR模型高效训练和扩散模型并行推理的优势。在通用任务上与SOTA开源AR模型相当,在科学推理任务上表现出色,成为最强大的扩散语言模型。
FireRedTeam
FireRedASR是一系列支持普通话、中国方言和英语的开源工业级自动语音识别(ASR)模型,在公开的普通话ASR基准测试中实现了新的最先进水平(SOTA),同时具备出色的歌词识别能力。
FireRedASR是一系列支持普通话、汉语方言和英语的开源工业级自动语音识别(ASR)模型,在公开普通话ASR基准测试中达到最新最优(SOTA)水平,同时具备卓越的歌词识别能力。
llava-hf
LLaVA-NeXT-Video是一个开源多模态聊天机器人,通过视频和图像数据混合训练获得优秀的视频理解能力,在VideoMME基准上达到开源模型SOTA水平。
WizardLMTeam
WizardCoder-33B-V1.1是基于deepseek-coder-33b-base训练的开源代码大语言模型,在HumanEval和MBPP等基准测试上表现优异,成为SOTA开源代码LLM。
THUDM
CogVLM 是一个强大的开源视觉语言模型(VLM),在多个跨模态基准测试上取得了SOTA性能。
zai-org
CogVLM是一个强大的开源视觉语言模型,拥有100亿视觉参数和70亿语言参数,在10个经典跨模态基准测试上取得了SOTA性能,在多个视觉语言任务中表现优异。