小米MiMo在全球最大AI模型API聚合平台OpenRouter上登顶全球调用量榜首,成为首个获此成就的国产大模型。近一个月,MiMo贡献1.45万亿Token调用量,在300多个模型中脱颖而出。其端云协同架构设计带来高推理效率和低成本,实用性优先的定位获全球开发者认可。生态上,Nous Research已与小米合作,MiMo系列全面接入增长最快的开源生态。
AMD发布vLLM-ATOM插件,旨在不改变现有工作流的前提下,充分挖掘硬件潜力,为DeepSeek-R1、Kimi-K2等主流大语言模型推理显著提速。vLLM本身是优化高并发场景吞吐量与显存利用率的开源框架,专注请求调度和缓存管理,ATOM插件则进一步强化了这一能力。
快手科技5月12日公告确认,正评估重组可灵AI业务,计划引入外部融资并推动独立上市。市场消息称,快手已启动Pre-IPO融资洽谈,拟融资20亿美元,目标估值200亿美元。此举旨在加速该大模型业务的独立扩张,利用外部资源提升竞争力。可灵AI作为国产视频生成模型,分拆后有望获得更快发展。
AMD发布vLLM-ATOM插件,专为大语言模型部署优化,在不改变现有工作流下,显著提升DeepSeek-R1、Kimi-K2等国产大模型在AMD硬件上的推理性能。该插件针对Instinct系列GPU定制,利用vLLM框架的高显存利用率优势,让开发者以低学习成本实现技术迁移,获得性能平滑升级。
国产化大模型,支持多模态,快速低成本智能化转型。
一键发起AI机器人对话,集成多款国产大模型。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
Baidu
128
$8
$240
52
Bytedance
$1.2
$3.6
4
Fugaku-LLM
Fugaku-LLM是使用超级计算机'富岳'从零开始预训练的日本国产大语言模型,具有高度透明性和安全性,日语表现尤为出色