当AI巨头聚焦大模型时,一场算力效率革命已悄然开启。顶尖开源推理引擎vLLM团队宣布成立AI基础设施公司Inferact,旨在为AI推理领域建立新秩序。这不仅是技术跃迁,更是AI迈向实用化的重要一步,已引发资本市场高度关注。
在2026年达沃斯论坛上,月之暗面总裁张予彤分享了中国大模型发展的“中国经验”。她强调,公司并非依赖巨额算力,而是仅用美国顶尖实验室1%的资源,就成功开发出Kimi K2等模型,展示了在有限条件下实现技术突破的创新路径。
在2026年CES展上,英伟达发布下一代AI平台“鲁宾”,核心为全新超级芯片Vera Rubin。该平台旨在为智能体AI和大规模推理模型提供更强算力,芯片采用创新集成设计,提升高性能计算效率。
科大讯飞宣布,其星火大模型在训练和推理效率上取得显著进展。不同于依赖英伟达显卡的传统方式,公司采用全国产算力方案,与华为合作克服技术难关,自2023年5月以来成功突破多个瓶颈。
智能算力即开即用,全面提升效率与竞争力。
Anthropic
$21
Input tokens/M
$105
Output tokens/M
200
Context Length
Google
$0.7
$2.8
1k
Iflytek
$2
-
Baichuan
4