AI云服务商Together AI完成8亿美元C轮融资,估值达83亿美元。本轮由沙特阿美创投领投,英伟达、Vista Equity Partners等跟投。该公司成立于2022年,专注提供英伟达GPU集群等AI基础设施租赁服务。
国产人工智能算力领域取得重要突破,摩尔线程近日发布并开源了业内首个基于国产全功能GPU底座的代码大模型MusaCoder。该模型专门用于GPU底层算子生成,其完整后训练流程在“夸娥”智算集群上完成,依托MTT S5000 GPU实现,标志着国产算力生态迈出关键一步。
Meta AI开源GCM工具包,旨在解决万亿参数AI模型训练中GPU集群的硬件不稳定问题。该工具为高性能计算领域提供了硬件管理方案,与传统Web开发中通过扩容解决延迟的方式不同。
马斯克宣布xAI下一代模型Grok 5推迟至2026年Q1发布,参数量达6万亿,原生支持视频理解,号称“每GB智能密度”创纪录。采用多模态MoE架构,可解析长视频并回答时序问题,目标领跑通用AI竞赛。训练使用X平台实时数据,正扩建GPU集群。同时披露特斯拉Optimus人形机器人进展。
首款实时生成式AI开放世界模型
免费开源AI模型推理服务
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
-
Bytedance
$0.8
$2
128
Alibaba
$0.4
$8.75
$70
400
$1.75
$14
$0.35
64
$0.63
$3.15
131
$1.8
$5.4
16
Tencent
32
$17.5
$56
$0.7
$2.4
$9.6
Google
$0.14
$0.28
用于Kubernetes集群中NVIDIA GPU硬件诊断的即时SRE诊断代理,通过MCP协议提供实时GPU硬件检测和故障排查功能。