Best 边缘设备 AI Tools & Models - Premium 边缘设备 News

AI News

挑战英伟达统治力：Cohere 发布开源轻量化语音模型 Transcribe

Cohere公司于2026年3月26日推出开源语音识别模型Cohere Transcribe。该模型拥有20亿参数，专为边缘设备设计，旨在解决语音模型因体积过大导致的延迟问题。通过Apache 2.0协议开源，Cohere希望借助开发者社区完善生态并实现商业化。模型支持14种语言，性能超越主流。

26.9k 13 hours ago

阿里通义千问开源 Qwen3.5小型模型系列：边缘设备也能跑多模态Agent

阿里通义千问团队推出Qwen3.5小型模型系列，包括0.8B、2B、4B、9B四款轻量级模型及对应基础版本。它们基于统一架构，具备原生多模态能力（支持图像-文本处理），结构改进且强化学习训练可扩展，能以更少计算资源实现更高智能水平。其中0.8B和2B模型极致小巧、推理极快，专为边缘设备优化。

15k 3 hours ago

协作终端变身 AI 引擎！思科发布新一代边缘 AI 基础架构设备

思科在ISE展上推出多款AI协作硬件，将会议室等场景转化为可管理的边缘基础架构。新品包括专为复杂环境设计的Room Kit Pro G2等，具备边缘智能处理能力，旨在提升协作效率。

10k 04-10

Liquid AI 发布 LFM2.5：一款面向边缘设备的小型 AI 模型家族

Liquid AI推出新一代小型基础模型LFM2.5，专为边缘设备和本地部署设计。该系列包括基础版和指令版，并扩展了日语、视觉语言及音频语言变种。模型基于LFM2混合架构，针对CPU和NPU优化，实现快速高效推理。开源权重已发布在Hugging Face平台。

19.9k 1 days ago

AI Products

Moonshine

快速准确的边缘设备自动语音识别模型

语音识别

11.4k

VILA

一个多图像视觉语言模型，具有训练、推理和评估方案，可从云端部署到边缘设备（如Jetson Orin和笔记本电脑）。

AI模型

14.1k

MobiLlama

为边缘设备定制的小型语言模型

AI模型

18.9k

Neuton TinyML

为边缘设备提供无代码人工智能

开发与工具

6.2k

Models

gpt-oss-20b

Openai

$0.4

Input tokens/M

Output tokens/M

128

Context Length

GLM-4.5-Air

Chatglm

Input tokens/M

Output tokens/M

128

Context Length

DeepSeek-V3

Deepseek

Input tokens/M

Output tokens/M

Context Length

Qwen3-0.6B

Alibaba

$0.3

Input tokens/M

Output tokens/M

Context Length

Qwen3-4B

Alibaba

$0.3

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E2B Instructed

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E4B

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E2B

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E2B Instructed LiteRT (Preview)

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E4B Instructed LiteRT Preview

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E4B Instructed

Google

$140

Input tokens/M

$280

Output tokens/M

Context Length

Qianfan-QI-VL

Baidu

Input tokens/M

Output tokens/M

Context Length

Hunyuan-Translation-Lite

Tencent

Input tokens/M

Output tokens/M

Context Length

GPT-4.1 nano

Openai

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Gemma 3 1B

Google

Input tokens/M

Output tokens/M

Context Length

DeepSeek-R1-Distill-Qwen-7B

Deepseek

Input tokens/M

Output tokens/M

Context Length

DeepSeek-R1-Distill-Qwen-1.5B

Deepseek

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_1.5b_base

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_3b_base

Alibaba

Input tokens/M

Output tokens/M

Context Length

ERNIE 4.5 Turbo VL

Baidu

Input tokens/M

Output tokens/M

128

Context Length

MCP

Mcp Bridge Api

MCP Bridge是一个轻量级、与LLM无关的RESTful代理，用于连接多个模型上下文协议（MCP）服务器，并通过统一的REST API暴露其功能。它解决了边缘设备、移动设备和Web浏览器等平台无法高效运行MCP服务器的问题，提供了可选的基于风险的执行级别，包括标准执行、确认工作流和Docker隔离等安全控制。

python

10.8k

2.5points

JetsonMCP

JetsonMCP是一个通过SSH连接管理NVIDIA Jetson Nano边缘计算设备的MCP服务器，提供AI工作负载优化、硬件配置和系统管理功能，支持自然语言指令转换为专业操作命令。

python

6.7k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

挑战英伟达统治力：Cohere 发布开源轻量化语音模型 Transcribe

阿里通义千问开源 Qwen3.5小型模型系列：边缘设备也能跑多模态Agent

协作终端变身 AI 引擎！思科发布新一代边缘 AI 基础架构设备

Liquid AI 发布 LFM2.5：一款面向边缘设备的小型 AI 模型家族

AI Products

Moonshine

VILA

MobiLlama

Neuton TinyML

Models

gpt-oss-20b

GLM-4.5-Air

DeepSeek-V3

Qwen3-0.6B

Qwen3-4B

Gemma 3n E2B Instructed

Gemma 3n E4B

Gemma 3n E2B

Gemma 3n E2B Instructed LiteRT (Preview)

Gemma 3n E4B Instructed LiteRT Preview

Gemma 3n E4B Instructed

Qianfan-QI-VL

Hunyuan-Translation-Lite

GPT-4.1 nano

Gemma 3 1B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-1.5B

Qwen_v2.5_1.5b_base

Qwen_v2.5_3b_base

ERNIE 4.5 Turbo VL

NV Reason CXR 3B GGUF

Qwen3 VL 8B Instruct 1M GGUF

Qwen3 VL 2B Instruct 1M GGUF

Qwen3 VL 8B Thinking GGUF

DeepSeek V3 0324 Moxin GGUF

Zen Nano 0.6b

LFM2 2.6B GGUF

LFM2 2.6B GGUF

Qwen2.5 Coder 3B Instruct_w8a8_g128_rk3588.rkllm

All MiniLM L6 V2 Quant.tflite

Hunyuan 0.5B Instruct GPTQ Int4

LFM2 700M GGUF

LFM2 350M GGUF

LFM2 1.2B GGUF

LFM2 1.2B GGUF

LFM2 350M

LFM2 1.2B

LFM2 700M

LFM2 350M

Loggenix Moe 0.12B A0.08B E5 Lr5e4 B16 3060 V2 Finetuned

MCP

Mcp Bridge Api

JetsonMCP