最好的XPU AI工具模型_精選XPU資訊

AI資訊

高通宣佈收購 AI 軟件企業 Modular，交易預計 2026 下半年完成

高通宣佈收購AI軟件公司Modular，交易預計2026年下半年完成，需滿足成交條件及監管批准。Modular專注爲不同架構AI XPU提供高效軟件棧，其AI原生平臺性能業界領先。此舉有助高通強化跨硬件生態的軟件能力。

15.1k 13 小時前

350 億美元入場：博通聯手金融巨頭，重塑 AI 算力基建版圖

芯片巨頭博通聯合阿波羅及黑石成立AI XPV平臺，投入巨資構建下一代算力基礎設施，支持前沿AI實驗室。博通提供定製化XPU及先進網絡方案，滿足大模型訓練需求。

10.4k 1 天前

軟銀加碼與 OpenAI 合作，Arm 將開發定製 CPU

軟銀與OpenAI深化合作，OpenAI與Arm合作定製CPU，並與博通合作開發AI XPU，共同構建自有芯片架構，以打造更強大的AI硬件系統。

11.3k 5 天前

PyTorch 2.8重磅發佈：量化LLM推理性能飛躍，Intel GPU 支持來襲！

PyTorch 2.8正式發佈，重點提升量化大語言模型在Intel CPU上的推理性能，支持A16W8等多種量化模式，測試顯示端到端延遲降低20%以上。新增對Intel GPU分佈式後端的實驗性支持，擴展硬件兼容性。其他改進包括：SYCL支持增強C++擴展API、XPU設備新增A16W4模式、穩定libtorch ABI接口、增強ROCm支持並新增gfx950架構。新版本還優化了控制流操作，提升模型編譯效率。下載地址：https://github.com/pytorch/pytorch/releases/tag/v2.8.0

16.7k 1 天前

PyTorch 2.8重磅發佈：量化LLM推理性能飛躍，Intel GPU 支持來襲！

模型

GPT OSS 120B

Openai

$0.63

輸入tokens/百萬

$3.15

輸出tokens/百萬

131

上下文長度

Wan2.1-T2V-1.3B

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Gemma 3 1B

Google

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Gemma 3 27B

Google

$0.7

輸入tokens/百萬

$1.4

輸出tokens/百萬

131

上下文長度

Gemma 3 4B

Google

$0.14

輸入tokens/百萬

$0.28

輸出tokens/百萬

131

上下文長度

Gemma 3 12B

Google

$0.35

輸入tokens/百萬

$0.7

輸出tokens/百萬

131

上下文長度

DeepSeek-R1-Distill-Llama-8B

Deepseek

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Qwen_v2.5_7b_base

Alibaba

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Gemma 2 27B

Google

輸入tokens/百萬

輸出tokens/百萬

上下文長度

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

​高通宣佈收購 AI 軟件企業 Modular，交易預計 2026 下半年完成

350 億美元入場：博通聯手金融巨頭，重塑 AI 算力基建版圖

​軟銀加碼與 OpenAI 合作，Arm 將開發定製 CPU

PyTorch 2.8重磅發佈：量化LLM推理性能飛躍，Intel GPU 支持來襲！

模型

GPT OSS 120B

Wan2.1-T2V-1.3B

Gemma 3 1B

Gemma 3 27B

Gemma 3 4B

Gemma 3 12B

DeepSeek-R1-Distill-Llama-8B

Qwen_v2.5_7b_base

Gemma 2 27B

高通宣佈收購 AI 軟件企業 Modular，交易預計 2026 下半年完成

軟銀加碼與 OpenAI 合作，Arm 將開發定製 CPU