英伟达计划五年投资260亿美元研发开放权重AI模型,从硬件巨头转向深度参与AI核心模型研发,推动开源生态发展。
中国AI模型发展迅速,Deepseek R1等创新引发全球关注。阿里巴巴Qwen模型家族表现突出,中国开放权重AI生态系统规模远超预期,在分发和应用方面已超越美国竞争对手。
阿布扎比人工智能集团G42发布开源印英大语言模型NANDA87B,拥有87亿参数,为早期版本升级。该模型由穆罕默德・本・扎耶德人工智能大学与G42旗下Inception公司及芯片商Cerebras合作开发,现已在Hugging Face平台开放权重,供开发者、创作者和企业自由使用与功能扩展。
OpenRouter基于超100万亿标记数据研究发现,自2024年12月o1推理模型推出后,大型语言模型使用方式显著变化。开放权重模型使用增长明显,尤其在创意角色扮演和编程辅助领域,超出预期。
Zonos-v0.1 是一个领先的开放权重文本到语音模型,能够生成高质量的多语言语音。
全新的Mistral Small,针对低延迟工作负载进行优化
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
EssentialAI
Rnj-1-instruct 是由 Essential AI 从头开始训练的 80 亿参数开放权重密集模型,针对代码、STEM 领域、智能体能力和工具调用进行了优化。它在多种编程语言中表现出色,同时在数学和科学领域也展现出强大实力,能力与最先进的开放权重模型相当。
Rnj-1 是由 Essential AI 从头训练的一系列 80 亿参数、开放权重的密集模型。该模型针对代码和 STEM 领域进行了优化,在编程、数学推理、智能体任务和工具调用方面表现出色,能力与最先进的开放权重模型相当。
stanford-oval
CHURRO是一个30亿参数的开放权重视觉语言模型,专门用于历史文档转录。它能够识别跨越22个世纪和46个语言集群的手写和印刷文本,包括历史语言和已消亡语言,在显著降低成本的条件下实现了比大型商业模型更高的准确率。
QuantFactory
这是Tesslate/WEBGEN-4B-Preview的量化版本,专注于生成单文件网站,能将提示转化为简洁、响应式的HTML/CSS/Tailwind代码。模型小巧适合本地运行和快速迭代,具有开放权重、移动优先输出、默认无外部JS等特点。
Sci-fi-vy
GPT-OSS-20B是OpenAI推出的开放权重模型,专为强大推理、智能体任务和多样化开发者用例设计。该模型具有210亿参数(其中36亿为活跃参数),采用混合专家架构,支持低延迟本地部署和特定场景应用。
professorf
GPT-OSS-20B是OpenAI推出的开放权重模型,拥有210亿参数(其中36亿为活跃参数),专为低延迟、本地部署和特定用例设计。该模型基于harmony响应格式训练,具备强大的推理能力和智能体任务处理能力。
0xShonen
GPT-OSS-20B是OpenAI发布的开放权重模型,专为强大的推理、智能体任务和多样化开发者用例设计。该模型具有21B参数(其中3.6B为活跃参数),支持低延迟推理和本地部署,采用Apache 2.0许可证,可自由用于实验、定制和商业部署。
axolotl-ai-co
gpt-oss-20b是OpenAI推出的开放权重模型,拥有210亿参数(其中36亿为活跃参数),专为低延迟、本地部署和特定场景设计。该模型基于harmony响应格式训练,具备强大的推理能力和智能体任务处理能力。
unsloth
GPT-OSS-20b是OpenAI推出的开放权重模型,具备强大的推理能力,采用Apache 2.0许可证,支持多种开发场景。该模型具有低延迟特点,适用于本地或特定使用场景,支持文本生成任务。
gabriellarson
gpt-oss-20b是OpenAI推出的开放权重模型,具备强大的推理能力,适用于代理任务和开发者的多样使用场景。该模型具有低延迟特性,适用于本地或特定场景部署。
openai
GPT-OSS系列是OpenAI推出的开放权重模型,专为强大的推理能力、智能体任务和多样化开发者用例设计。该模型能有效解决复杂问题,提供灵活高效的使用体验,支持Apache 2.0开源许可证。
GPT-OSS系列是OpenAI发布的开放权重模型,专为强大推理、智能体任务和多样化开发者用例设计。120B版本拥有1170亿参数(其中51亿为活跃参数),适用于生产环境和需要高推理能力的场景。
InvokeAI
FLUX.1 Krea [dev] 是一个拥有120亿参数的整流流变换器,能够根据文本描述生成高质量图像。该模型专注于美学摄影,在图像质量和指令遵循方面表现卓越,采用引导蒸馏进行高效训练,并开放权重以推动科研和艺术创作。
FLUX.1 Krea [dev] 是一个拥有120亿参数的先进整流流变换器模型,专门用于根据文本描述生成高质量图像。该模型在美学摄影领域表现卓越,具有出色的提示遵循能力,采用引导蒸馏技术训练,并开放权重供非商业用途使用。
black-forest-labs
FLUX.1 Krea [dev] 是一个拥有120亿参数的整流流变换器,专门用于根据文本描述生成高质量图像。它在输出质量、指令遵循等方面表现出色,专注于美学摄影,采用高效的引导蒸馏训练方式,并开放权重以推动科研和创意工作。
Phi-4-reasoning-plus是微软基于Phi-4微调的最先进开放权重推理模型,专注于数学、科学和编码领域的高级推理能力。
CohereLabs
Aya Expanse 8B 是一款具有高度先进多语言能力的开放权重研究模型,结合了高性能的预训练模型与Cohere Labs一年专注研究的成果。
Aya-23是一个开放权重的指令微调模型研究版本,具有高度先进的多语言能力,支持23种语言。
microsoft
Phi-4-reasoning-plus 是微软研究院开发的先进开放权重推理模型,基于 Phi-4 通过监督微调和强化学习优化,专注于数学、科学和编码领域的高级推理能力。
Phi-4推理是基于Phi-4通过监督微调思维链轨迹数据集和强化学习训练的前沿开放权重推理模型,专注于数学、科学和编程技能。