AMD發佈vLLM-ATOM插件,專爲大語言模型部署優化,在不改變現有工作流下,顯著提升DeepSeek-R1、Kimi-K2等國產大模型在AMD硬件上的推理性能。該插件針對Instinct系列GPU定製,利用vLLM框架的高顯存利用率優勢,讓開發者以低學習成本實現技術遷移,獲得性能平滑升級。
AMD於2025年11月11日收購AI推理初創公司MK1,旨在強化其在AI推理領域的戰略佈局。MK1的核心技術“Flywheel”與AMD的Instinct GPU深度優化,日處理超萬億token,顯著提升推理能力。收購後,MK1團隊將併入AMD AI事業部,助力公司鞏固市場地位。
AMD與甲骨文達成重要合作,甲骨文計劃自2026年第三季度起在其數據中心部署多達5萬塊AMD最新Instinct MI450 AI芯片,採用新一代"Helios"機架設計。此舉將助力AMD在AI領域擴張,增強與英偉達的競爭力。
AMD與OpenAI達成多年芯片供應協議,AMD將提供總計6千兆瓦計算能力,覆蓋多代Instinct GPU產品線,首批爲MI450GPU。該協議預計爲AMD帶來數百億美元收入,顯著提升其在AI行業競爭力。
instinctools是德美軟件產品開發和諮詢公司,專注數字轉型服務。
為AI基礎設施提供領導性的AI性能
Alibaba
$1
輸入tokens/百萬
$10
輸出tokens/百萬
256
上下文長度
$2
-
$15.8
$12.7
64
$0.75
$4
1k
$8
32
$0.5
128
131
Tencent
$6
$18
8
Iflytek
QuantFactory
Instinct是基於Qwen2.5-Coder-7B的代碼編輯模型,經過真實世界代碼編輯數據集微調,能夠智能預測開發者的下一步操作,保持流暢編程狀態。該GGUF量化版本由QuantFactory創建,提供高效的本地推理能力。
DevQuasar
這是 continuedev/instinct 模型的量化版本,致力於通過量化技術讓知識更易於獲取和使用,降低部署門檻。
continuedev
Instinct是Continue推出的最先進的開放下一次編輯模型,基於Qwen2.5-Coder-7B模型,在真實世界代碼編輯數據集上進行了穩健的微調,能夠智能預測開發者的下一步操作
Motif-Technologies
Motif 2.6B是一個擁有26億參數的語言模型,在AMD Instinct™ MI250 GPU上從頭開始訓練,旨在構建符合人類價值觀、有用且可靠的AI。
amd
Instella是AMD基於Instinct™ MI300X GPU從頭訓練的30億參數完全開源語言模型系列,性能超越同等規模的開源模型,並與Llama-3.2-3B、Gemma-2-2B等先進開放權重模型競爭。
AMD基於Instinct MI300X GPU訓練的30億參數全開放語言模型家族,性能超越同規模開放模型
Instella是由AMD開發的30億參數開源語言模型系列,基於AMD Instinct™ MI300X GPU訓練,性能超越同規模全開源模型。
AMD Nitro Diffusion 是一系列高效的文本生成圖像模型,基於 AMD Instinct™ GPU 從主流擴散模型蒸餾而來。PixArt-Sigma Nitro 是基於 Transformer 的高分辨率單步推理模型。
基於AMD Instinct™ GPU從主流擴散模型蒸餾而成的高效文生圖模型系列
AMD-OLMo是由AMD在AMD Instinct™ MI250 GPU上從頭開始訓練的10億參數語言模型系列,包括預訓練模型、監督微調模型和基於直接偏好優化(DPO)的對齊模型。該系列模型基於OLMo架構,在Dolma數據集上進行預訓練,並在多個指令數據集上進行微調。
AMD-OLMo 是由 AMD 在 AMD Instinct™ MI250 GPU 上從頭開始訓練的一系列 10 億參數語言模型。