中国开源AI大模型实力凸显,DeepSeek、Qwen和Kimi在最新评比中影响力并列第一。榜单由AI研究员发布,涵盖35家机构,超半数为中国团队,展现中国开源领域的快速发展,与美国闭源模式形成对比。
Meta计划于2026年春季发布代号“Avocado”的AI模型,可能转向闭源,并使用了阿里巴巴开源模型Qwen进行训练。消息引发市场关注,阿里巴巴股价上涨。
Meta计划2024年一季度发布新一代AI大模型“牛油果”,该模型在开发中借助阿里巴巴Qwen模型进行蒸馏学习以提升能力,并可能以闭源形式推出,严格控制访问权限。
Meta 下一代旗舰大模型代号 Avocado,定位为 Llama 系列继任者,计划于 2026 年第一季度发布。该模型将采用闭源商业化路线,性能对标 GPT-5 与 Gemini,旨在与 OpenAI、Google 等公司的封闭模型生态正面竞争。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
Baidu
128
$8
$240
52
Bytedance
$1.2
$3.6
4
unsloth
Apertus是一款由瑞士AI开发的全开放多语言大语言模型,提供70亿和80亿两种参数规模。该模型支持超过1000种语言,使用完全合规且开放的训练数据,性能可与闭源模型相媲美。Apertus在15T标记上进行预训练,采用分阶段课程训练方法,支持长达65,536个标记的上下文长度。
redponike
Apertus是一款由瑞士AI开发的全开放多语言大语言模型,参数规模达80亿和700亿,支持超过1000种语言和长上下文处理,仅使用完全合规的开放训练数据,性能可与闭源模型相媲美。
tencent
腾讯开源的大规模视频生成模型,支持文本到视频生成,性能媲美主流闭源模型。
meta-llama
Llama 3.2是Meta推出的多语言大语言模型,提供1B和3B两种参数规模,支持多种语言任务,性能优于现有开源和闭源模型。
Meta羊驼3.1是支持8种语言的大语言模型系列,包含8B/70B/405B三种规模,在行业基准测试中超越多数开源和闭源聊天模型
TheCraftySlayer
Llama 2是由Meta开发的700亿参数对话优化大语言模型,在多数测试基准中超越开源对话模型,安全性堪比主流闭源模型
Meta开源的700亿参数对话优化大语言模型,在安全性和实用性上媲美主流闭源模型
google
T5-11b-ssm-nq是基于T5架构的大型语言模型,专门用于闭卷问答任务。该模型通过预训练和微调,能够在没有外部知识源的情况下回答问题。