Nvidia近期收购开源工作负载管理系统Slurm的主要开发者SchedMD,并推出新一代开放AI模型Nemotron 3系列。此举旨在推动开源技术发展,支持高性能计算和人工智能创新。Slurm自2002年推出以来,已成为高性能计算和AI领域的重要工具。
AMD与HPE深化合作,共同推动开放式、可扩展AI基础设施建设。合作以AMD专为大规模AI工作负载设计的“Helios”全栈平台为基础,HPE将成为首批采用该架构的系统提供商之一。同时,HPE将结合与博通合作开发的Juniper网络交换机,确保AI集群间的高带宽、低延迟连接,加速新一代AI基础设施发展。
IBM与Groq合作,将Watsonx Orchestrate平台与GroqCloud推理技术结合,加速企业AI应用。该合作宣称能提升成本效率,AI工作负载处理速度比传统GPU快五倍以上,低延迟特性尤其适用于医疗、金融和政府等受监管行业。
Airtel与IBM达成战略合作,共同提升Airtel Cloud服务。结合Airtel在电信领域的高可靠性和数据驻留优势,以及IBM在云基础设施与AI推理软件的专业技术,双方将助力监管行业企业高效扩展AI工作负载,确保本地、云端及边缘基础设施的互操作性。
专为AI智能体打造的云平台,可自动执行AI生成代码和智能工作负载
3FS是一个高性能分布式文件系统,专为AI训练和推理工作负载设计。
Verizon AI Connect 是一套用于管理和扩展 AI 资源密集型工作负载的策略和产品解决方案。
AMD开源平台,提升AI、ML和HPC工作负载性能
Alibaba
-
Input tokens/M
Output tokens/M
Context Length
Bytedance
Xai
$1.4
$10.5
256
Baidu
Tencent
$2
Openai
$0.4
128
Anthropic
$105
$525
200
Chatglm
Sail是一个旨在统一流处理、批处理和计算密集型(AI)工作负载的项目,提供了Spark SQL和Spark DataFrame API的替代方案,支持单机和分布式环境。
Tigris MCP Server是一个高性能、兼容S3的对象存储系统,专为多云和AI工作负载设计,通过MCP协议实现AI代理与Tigris存储功能的无缝连接。
JetsonMCP是一个通过SSH连接管理NVIDIA Jetson Nano边缘计算设备的MCP服务器,提供AI工作负载优化、硬件配置和系统管理功能,支持自然语言指令转换为专业操作命令。
JetsonMCP是一个MCP服务器,通过SSH连接帮助AI助手管理和优化NVIDIA Jetson Nano边缘计算系统,提供AI工作负载部署、硬件优化和系统管理功能。