最好的边缘计算 AI工具模型_精选边缘计算资讯

AI资讯

英伟达公开表示为谷歌AI成就感到高兴，但我们目前仍是行业领先

英伟达回应谷歌AI进展，强调自身在AI基础设施领域的核心地位，称其是唯一能运行所有主流AI模型、覆盖云端到边缘计算的全平台，领先行业约一代。黄仁勋指出，英伟达通用GPU在性能、灵活性和可替代性上优于专用AI芯片。

9.7k 21 小时前

IBM 发布 Granite 4.0 Nano 模型，突破小型 AI 模型的性能极限

IBM发布Granite4.0Nano系列AI模型，参数规模350万至15亿，强调高效与可及性。模型可在笔记本电脑或浏览器本地运行，无需依赖云计算，支持开发者在普通硬件或边缘设备构建应用，突破行业依赖云服务的常规趋势。

12.2k 3 天前

IBM 发布 Granite 4.0 Nano 模型，突破小型 AI 模型的性能极限

Liquid AI发布 LFM2-8B-A1B：8B 参数仅激活1.5B，手机上跑出4B级AI速度！

Liquid AI推出LFM2-8B-A1B模型，采用稀疏激活MoE架构，总参数量8.3B但每token仅激活1.5B参数。该设计在保持高表示能力的同时显著降低计算负载，突破“小规模MoE低效”认知，专为资源受限的边缘设备优化，支持实时交互场景。

15.5k 6 天前

Liquid AI发布 LFM2-8B-A1B：8B 参数仅激活1.5B，手机上跑出4B级AI速度！

LiquidAI 推出 Liquid Nanos 系列轻量级 AI 模型，优化边缘设备应用

LiquidAI推出轻量级AI模型系列Liquid Nanos，专为树莓派等边缘计算设备设计。该系列提供350M和1.2B两种参数版本，支持翻译、信息抽取、RAG、工具调用和数学推理五大应用场景，满足低功耗高性能需求，为开发者提供多样化边缘AI解决方案。

10.5k 5 天前

AI产品

Hailo AI

提供AI边缘处理器，专为实现高性能深度学习应用而设计。

AI模型

9.6k

RF-DETR

RF-DETR 是由 Roboflow 开发的实时目标检测模型。

目标检测

18.3k

OmniAudio-2.6B

世界上最快的边缘部署音频语言模型

语音识别

10.6k

SmolVLM

高效开源的视觉语言模型

AI模型

9.9k

模型

o3-mini

Openai

$7.7

输入tokens/百万

$30.8

输出tokens/百万

200

上下文长度

Claude Sonnet 4.5

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Hunyuan-T1-latest

Tencent

输入tokens/百万

输出tokens/百万

上下文长度

gpt-oss-20b

Openai

$0.4

输入tokens/百万

输出tokens/百万

128

上下文长度

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

输入tokens/百万

输出tokens/百万

256

上下文长度

GPT-5 mini

Openai

$1.75

输入tokens/百万

$14

输出tokens/百万

400

上下文长度

GLM-4.5-Air

Chatglm

输入tokens/百万

输出tokens/百万

128

上下文长度

Gemma 3n E2B Instructed

Google

输入tokens/百万

输出tokens/百万

上下文长度

Gemma 3n E4B

Google

输入tokens/百万

输出tokens/百万

上下文长度

Gemma 3n E2B

Google

输入tokens/百万

输出tokens/百万

上下文长度

Gemma 3n E4B Instructed LiteRT Preview

Google

输入tokens/百万

输出tokens/百万

上下文长度

Qianfan-QI-VL

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

Hunyuan-Translation-Lite

Tencent

输入tokens/百万

输出tokens/百万

上下文长度

Qwen3-8B

Alibaba

$0.5

输入tokens/百万

输出tokens/百万

上下文长度

GPT-4.1 nano

Openai

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

DeepSeek-R1-Distill-Qwen-7B

Deepseek

输入tokens/百万

输出tokens/百万

上下文长度

DeepSeek-R1-Distill-Qwen-1.5B

Deepseek

输入tokens/百万

输出tokens/百万

上下文长度

Qwen_v2.5_3b_base

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

Qwen_v2.5_1.5b_base

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

ERNIE 4.5 Turbo

Baidu

$0.8

输入tokens/百万

$3.2

输出tokens/百万

128

上下文长度

MCP

Opencv Mcp Server

OpenCV MCP Server是一个基于Python的计算机视觉服务，通过Model Context Protocol (MCP)提供OpenCV的图像和视频处理能力。它为AI助手和语言模型提供从基础图像处理到高级对象检测的全套计算机视觉工具，包括图像处理、边缘检测、人脸识别、视频分析和实时对象跟踪等功能。

python

10.1k

2.5分