最好的NPU AI工具模型_精选NPU资讯

AI资讯

受特斯拉AI6 芯片生产计划变更波及，韩国AI黑马DX-M2 量产推迟至 2026 年三季度

特斯拉生产计划变动导致三星2nm产线排期调整，韩国AI芯片企业DeepX的下一代NPU芯片DX-M2量产被迫推迟半年，预计2026年第三季度后才能开始测试。这凸显了半导体代工行业大客户优先的排产规则对小企业的影响。

华硕推“即插即用”AI加速卡UGen300：40 TOPS算力塞进USB，让普通电脑秒变AI终端

华硕推出UGen300 AI加速卡，采用USB接口设计，无需拆机或占用PCIe插槽，通过USB 3.1 Gen2线缆即可为PC、工控机等设备提供40 TOPS的本地AI推理能力。核心搭载Hailo-10H NPU芯片，功耗仅2.5瓦，板载8GB内存，支持直接运行大型预训练模型。

24.7k 9 小时前

Liquid AI 发布 LFM2.5：一款面向边缘设备的小型 AI 模型家族

Liquid AI推出新一代小型基础模型LFM2.5，专为边缘设备和本地部署设计。该系列包括基础版和指令版，并扩展了日语、视觉语言及音频语言变种。模型基于LFM2混合架构，针对CPU和NPU优化，实现快速高效推理。开源权重已发布在Hugging Face平台。

17.9k 5 小时前

你的 Copilot+ PC 又变强了?微软首次公开 AI 模型更新清单，Phi Silica 赫然在列

微软为Windows 11的AI组件提供详细更新日志，帮助用户追踪本地AI模型的静默更新。这些组件是Copilot+ PC实现本地AI体验的基础，需NPU算力支持，涵盖语义分析、图像处理等功能。

9.6k 4 天前

你的 Copilot+ PC 又变强了?微软首次公开 AI 模型更新清单，Phi Silica 赫然在列

AI产品

Snapdragon X Series

新一代骁龙X系列，搭载NPU，为创作者带来革新工具。

开发与工具

9.4k

ZETIC.ai

构建零成本的设备端AI。

开发与工具

9.4k

Intel NPU Acceleration Library

英特尔神经处理单元加速库

AI模型推理训练

15.2k

模型

GPT OSS 120B

Openai

$0.63

输入tokens/百万

$3.15

输出tokens/百万

131

上下文长度

Wan2.1-T2V-1.3B

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

Gemma 3 4B

Google

$0.14

输入tokens/百万

$0.28

输出tokens/百万

131

上下文长度

Gemma 3 1B

Google

输入tokens/百万

输出tokens/百万

上下文长度

Gemma 3 12B

Google

$0.35

输入tokens/百万

$0.7

输出tokens/百万

131

上下文长度

Gemma 3 27B

Google

$0.7

输入tokens/百万

$1.4

输出tokens/百万

131

上下文长度

DeepSeek-R1-Distill-Llama-8B

Deepseek

输入tokens/百万

输出tokens/百万

上下文长度

Qwen_v2.5_7b_base

Alibaba

输入tokens/百万

输出tokens/百万

128

上下文长度

Gemma 2 27B

Google

输入tokens/百万

输出tokens/百万

上下文长度

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

受特斯拉AI6 芯片生产计划变更波及，韩国AI黑马DX-M2 量产推迟至 2026 年三季度

华硕推“即插即用”AI加速卡UGen300：40 TOPS算力塞进USB，让普通电脑秒变AI终端

Liquid AI 发布 LFM2.5：一款面向边缘设备的小型 AI 模型家族

你的 Copilot+ PC 又变强了?微软首次公开 AI 模型更新清单，Phi Silica 赫然在列

AI产品

Snapdragon X Series

ZETIC.ai

Intel NPU Acceleration Library

模型

GPT OSS 120B

Wan2.1-T2V-1.3B

Gemma 3 4B

Gemma 3 1B

Gemma 3 12B

Gemma 3 27B

DeepSeek-R1-Distill-Llama-8B

Qwen_v2.5_7b_base

Gemma 2 27B

Qwen3 VL 4B Instruct NPU

Llama 3.1 8B Onnx Ryzenai Npu

OmniNeural 4B

Llama 3.1 8B NPU2

Llama 3.2 1B NPU2

Sdxl Turbo Ryzen Ai

MiniCPM V 2_6 Rk3588 1.1.4

Phi 3.5 Mini Instruct Awq G128 Int4 Asym Bf16 Onnx Ryzen Strix

Llama 3 8B Awq G128 Int4 Asym Bf16 Onnx Ryzen Strix

Ezrkllm Collection