AMD发布vLLM-ATOM插件,专为大语言模型部署优化,在不改变现有工作流下,显著提升DeepSeek-R1、Kimi-K2等国产大模型在AMD硬件上的推理性能。该插件针对Instinct系列GPU定制,利用vLLM框架的高显存利用率优势,让开发者以低学习成本实现技术迁移,获得性能平滑升级。
AMD于2025年11月11日收购AI推理初创公司MK1,旨在强化其在AI推理领域的战略布局。MK1的核心技术“Flywheel”与AMD的Instinct GPU深度优化,日处理超万亿token,显著提升推理能力。收购后,MK1团队将并入AMD AI事业部,助力公司巩固市场地位。
AMD与甲骨文达成重要合作,甲骨文计划自2026年第三季度起在其数据中心部署多达5万块AMD最新Instinct MI450 AI芯片,采用新一代"Helios"机架设计。此举将助力AMD在AI领域扩张,增强与英伟达的竞争力。
AMD与OpenAI达成多年芯片供应协议,AMD将提供总计6千兆瓦计算能力,覆盖多代Instinct GPU产品线,首批为MI450GPU。该协议预计为AMD带来数百亿美元收入,显著提升其在AI行业竞争力。
instinctools是德美软件产品开发和咨询公司,专注数字转型服务。
为AI基础设施提供领导性的AI性能
Alibaba
$1
输入tokens/百万
$10
输出tokens/百万
256
上下文长度
$2
-
$15.8
$12.7
64
$0.75
$4
1k
$8
32
$0.5
128
131
Tencent
$6
$18
8
Iflytek
QuantFactory
Instinct是基于Qwen2.5-Coder-7B的代码编辑模型,经过真实世界代码编辑数据集微调,能够智能预测开发者的下一步操作,保持流畅编程状态。该GGUF量化版本由QuantFactory创建,提供高效的本地推理能力。
DevQuasar
这是 continuedev/instinct 模型的量化版本,致力于通过量化技术让知识更易于获取和使用,降低部署门槛。
continuedev
Instinct是Continue推出的最先进的开放下一次编辑模型,基于Qwen2.5-Coder-7B模型,在真实世界代码编辑数据集上进行了稳健的微调,能够智能预测开发者的下一步操作
Motif-Technologies
Motif 2.6B是一个拥有26亿参数的语言模型,在AMD Instinct™ MI250 GPU上从头开始训练,旨在构建符合人类价值观、有用且可靠的AI。
amd
Instella是AMD基于Instinct™ MI300X GPU从头训练的30亿参数完全开源语言模型系列,性能超越同等规模的开源模型,并与Llama-3.2-3B、Gemma-2-2B等先进开放权重模型竞争。
AMD基于Instinct MI300X GPU训练的30亿参数全开放语言模型家族,性能超越同规模开放模型
Instella是由AMD开发的30亿参数开源语言模型系列,基于AMD Instinct™ MI300X GPU训练,性能超越同规模全开源模型。
AMD Nitro Diffusion 是一系列高效的文本生成图像模型,基于 AMD Instinct™ GPU 从主流扩散模型蒸馏而来。PixArt-Sigma Nitro 是基于 Transformer 的高分辨率单步推理模型。
基于AMD Instinct™ GPU从主流扩散模型蒸馏而成的高效文生图模型系列
AMD-OLMo是由AMD在AMD Instinct™ MI250 GPU上从头开始训练的10亿参数语言模型系列,包括预训练模型、监督微调模型和基于直接偏好优化(DPO)的对齐模型。该系列模型基于OLMo架构,在Dolma数据集上进行预训练,并在多个指令数据集上进行微调。
AMD-OLMo 是由 AMD 在 AMD Instinct™ MI250 GPU 上从头开始训练的一系列 10 亿参数语言模型。