最好的NPU AI工具模型_精選NPU資訊

AI資訊

受特斯拉AI6 芯片生產計劃變更波及，韓國AI黑馬DX-M2 量產推遲至 2026 年三季度

特斯拉生產計劃變動導致三星2nm產線排期調整，韓國AI芯片企業DeepX的下一代NPU芯片DX-M2量產被迫推遲半年，預計2026年第三季度後才能開始測試。這凸顯了半導體代工行業大客戶優先的排產規則對小企業的影響。

華碩推“即插即用”AI加速卡UGen300：40 TOPS算力塞進USB，讓普通電腦秒變AI終端

華碩推出UGen300 AI加速卡，採用USB接口設計，無需拆機或佔用PCIe插槽，通過USB 3.1 Gen2線纜即可爲PC、工控機等設備提供40 TOPS的本地AI推理能力。核心搭載Hailo-10H NPU芯片，功耗僅2.5瓦，板載8GB內存，支持直接運行大型預訓練模型。

24.9k 13 小時前

Liquid AI 發佈 LFM2.5：一款面向邊緣設備的小型 AI 模型家族

Liquid AI推出新一代小型基礎模型LFM2.5，專爲邊緣設備和本地部署設計。該系列包括基礎版和指令版，並擴展了日語、視覺語言及音頻語言變種。模型基於LFM2混合架構，針對CPU和NPU優化，實現快速高效推理。開源權重已發佈在Hugging Face平臺。

17.9k 1 小時前

你的 Copilot+ PC 又變強了?微軟首次公開 AI 模型更新清單，Phi Silica 赫然在列

微軟爲Windows 11的AI組件提供詳細更新日誌，幫助用戶追蹤本地AI模型的靜默更新。這些組件是Copilot+ PC實現本地AI體驗的基礎，需NPU算力支持，涵蓋語義分析、圖像處理等功能。

9.6k 6 天前

你的 Copilot+ PC 又變強了?微軟首次公開 AI 模型更新清單，Phi Silica 赫然在列

AI產品

Snapdragon X Series

新一代驍龍X系列，搭載NPU，為創作者帶來革新工具。

開發與工具

8.9k

ZETIC.ai

構建零成本的設備端AI。

開發與工具

6.7k

Intel NPU Acceleration Library

英特爾神經處理單元加速庫

AI模型推理訓練

13.2k

模型

GPT OSS 120B

Openai

$0.63

輸入tokens/百萬

$3.15

輸出tokens/百萬

131

上下文長度

Wan2.1-T2V-1.3B

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Gemma 3 1B

Google

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Gemma 3 4B

Google

$0.14

輸入tokens/百萬

$0.28

輸出tokens/百萬

131

上下文長度

Gemma 3 27B

Google

$0.7

輸入tokens/百萬

$1.4

輸出tokens/百萬

131

上下文長度

Gemma 3 12B

Google

$0.35

輸入tokens/百萬

$0.7

輸出tokens/百萬

131

上下文長度

DeepSeek-R1-Distill-Llama-8B

Deepseek

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Qwen_v2.5_7b_base

Alibaba

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Gemma 2 27B

Google

輸入tokens/百萬

輸出tokens/百萬

上下文長度

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

受特斯拉AI6 芯片生產計劃變更波及，韓國AI黑馬DX-M2 量產推遲至 2026 年三季度

華碩推“即插即用”AI加速卡UGen300：40 TOPS算力塞進USB，讓普通電腦秒變AI終端

Liquid AI 發佈 LFM2.5：一款面向邊緣設備的小型 AI 模型家族

你的 Copilot+ PC 又變強了?微軟首次公開 AI 模型更新清單，Phi Silica 赫然在列

AI產品

Snapdragon X Series

ZETIC.ai

Intel NPU Acceleration Library

模型

GPT OSS 120B

Wan2.1-T2V-1.3B

Gemma 3 1B

Gemma 3 4B

Gemma 3 27B

Gemma 3 12B

DeepSeek-R1-Distill-Llama-8B

Qwen_v2.5_7b_base

Gemma 2 27B

Qwen3 VL 4B Instruct NPU

Llama 3.1 8B Onnx Ryzenai Npu

OmniNeural 4B

Llama 3.1 8B NPU2

Llama 3.2 1B NPU2

Sdxl Turbo Ryzen Ai

MiniCPM V 2_6 Rk3588 1.1.4

Phi 3.5 Mini Instruct Awq G128 Int4 Asym Bf16 Onnx Ryzen Strix

Llama 3 8B Awq G128 Int4 Asym Bf16 Onnx Ryzen Strix

Ezrkllm Collection