英伟达加速构建AI生态,本周宣布收购高性能计算调度系统Slurm开发商SchedMD,并发布开源大模型家族Nemotron 3,全面押注AI智能体与物理智能。Slurm作为全球主流超算调度系统,将强化英伟达基础设施层实力。
亚马逊在re:Invent2025推出第二代自研大模型家族Nova2,包括Lite、Pro、Sonic和Omni四款新品,主打行业领先性价比,定价约为同类模型一半。同时宣布与谷歌云互联,方便客户跨平台调用竞对模型。
阿里云推出通义千问Qwen3-VL系列两款新密集模型(2B与32B),使该系列开源模型总数达24个,形成从轻量到超大规模的技术矩阵。目前包含四款密集模型和两款专家混合模型,强化了模型生态的完整性与竞争力。
蚂蚁集团开源万亿参数大模型Ling-1T,采用FP8低精度训练,为当前最大基座模型。该模型由"百灵"团队开发,属于Ling2.0家族,包含Ling、Ring、Ming三大系列。其中Ling系列专注通用任务,强调速度与效率优势。
OpenELM是一套高效的语言模型家族,具备开源训练和推理框架。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$6
$24
$2
$20
Nanbeige
Nanbeige4-3B-Thinking是第四代Nanbeige大语言模型家族中的30亿参数推理模型,通过提升数据质量和训练方法实现了先进的推理能力。该模型在数学、科学、创意写作、工具使用等多个领域表现出色,支持多阶段课程学习和强化学习训练。
inclusionAI
Ling 2.0是基于MoE架构的大语言模型家族,首个版本Ling-mini-2.0参数规模紧凑但功能强大,在复杂推理和指令遵循方面表现出色,采用1/32激活率的MoE架构,实现卓越性能与高效运行的完美结合。
OpenGVLab
InternVL3.5是开源多模态模型家族的新成员,显著提升了InternVL系列的通用性、推理能力和推理效率,支持GUI交互等新功能,达到开源多模态大语言模型的先进水平。
unsloth
Gemma 3是谷歌推出的轻量级开源多模态模型家族,能够处理文本和图像输入并生成文本输出。具有128K大上下文窗口,支持140多种语言,适用于文本生成和图像理解等多种任务。
google
Gemma 3是Google推出的轻量级、最先进的多模态开放模型家族,基于与Gemini模型相同的研究和技术构建。该模型能够处理文本和图像输入并生成文本输出,具有128K的大上下文窗口,支持超过140种语言,提供从270M到27B的多种尺寸选择。
Gemma 3是谷歌推出的轻量级、最先进的多模态开放模型家族,能够处理文本和图像输入并生成文本输出。具有128K大上下文窗口,支持超过140种语言,提供从270M到27B多种规模选择,适用于各种文本生成和图像理解任务。
ibm-esa-geospatial
Llama3-MS-CLIP是CLIP家族中首个能够理解多光谱图像的视觉语言模型,基于SSL4EO-S12-v1.1数据集的一百万个图像-文本对以及生成的描述进行训练,在大多数基准测试中表现优于其他基于RGB的模型。
tiiuae
Falcon-H1是由阿联酋技术创新研究所开发的新型大语言模型家族,采用结合Transformer注意力机制和状态空间模型(SSMs)的混合架构,具备出色的长上下文记忆能力和计算效率。该系列模型提供从0.5B到34B参数的多种配置,在推理、数学、多语言任务等方面表现卓越。
Gemma 3是谷歌推出的轻量级、最先进的开放模型家族,基于与Gemini模型相同的研究和技术构建。该27B版本采用量化感知训练(QAT),能够在显著降低内存需求的同时保持与bfloat16相近的质量,具备多模态处理能力和128K大上下文窗口。
zai-org
GLM-4-Z1-32B-0414是GLM家族新一代开源大语言模型,拥有320亿参数,具备深度思考能力。通过冷启动和扩展强化学习训练,在数学、代码和逻辑任务上表现优异,支持便捷的本地部署。
GLM-4-32B-0414是GLM家族的新成员,拥有320亿参数的高性能大语言模型。该模型在15T高质量数据上进行预训练,包含大量推理型合成数据,在代码生成、函数调用、搜索问答等多个任务场景中表现出色,性能可与GPT-4o和DeepSeek-V3等更大规模模型相媲美。
maitrix-org
Voila是一个大型语音-语言基础模型家族,旨在提升人机交互体验,支持实时、低延迟的语音交互和多语言处理。
Voila是一个全新的大型语音-语言基础模型家族,旨在将人机交互体验提升至新高度。
CYFRAGOVPL
PLLuM 是一个专注于波兰语及其他斯拉夫/波罗的海语言的大型语言模型家族,同时融入英语数据以实现更广泛的泛化能力。
PLLuM-12B-chat是波兰大语言模型家族中的120亿参数对话优化版本,专为波兰语及斯拉夫/波罗的海语言设计,通过指令微调和偏好学习实现安全高效的交互能力。
PLLuM 是专门针对波兰语及其他斯拉夫/波罗的海语言优化的大型语言模型家族,兼具英语泛化能力,通过高质量数据训练和先进对齐技术开发而成。
PLLuM是专门针对波兰语及其他斯拉夫/波罗的海语言的大型语言模型家族,同时融入英语数据实现更广泛泛化。基于高质量文本语料库构建,通过指令调整、偏好学习和先进对齐技术优化,旨在生成上下文连贯的文本,为各种任务提供帮助。
stanfordmimi
由六种大规模、可泛化的2D/3D变分自编码器组成的医学影像处理模型家族,能够将医学图像编码为压缩的潜在表征,并实现高保真度的图像重建。
mav23
芦荟(Aloe)是一个全新的医疗大语言模型家族,通过模型融合和先进的提示策略,在同类型开源模型中极具竞争力。