Best 轻量级模型 AI Tools & Models - Premium 轻量级模型 News

Phi-4-multimodal-instruct

Phi-4-multimodal-instruct 是微软开发的轻量级多模态基础模型，支持文本、图像和音频输入。

AI模型

11.9k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

K8m

K8M是一款AI驱动的轻量级Kubernetes控制台工具，集成大模型能力，支持多集群管理和MCP服务。

10.7k

3.5points

Just Prompt

轻量级多模型LLM统一接口服务

10.7k

3.5points

Workos Mcp

这是一个基于Cloudflare Workers的轻量级模型控制协议(MCP)服务器，用于让代理（如Cursor代理）与WorkOS API交互。项目提供自动化部署和工具扩展功能。

10k

Vercel Api Mcp

一个基于Cloudflare Workers的轻量级模型控制协议(MCP)服务器，用于AI代理与Vercel API交互

10.6k

Mcp Server Notifier

MCP Server Notifier 是一个轻量级通知服务，与模型上下文协议（MCP）集成，可在AI代理完成任务时发送Webhook通知。支持多种Webhook提供商（如Discord、Slack、Teams等），提供图像支持、多项目管理、自定义消息等功能，易于与AI工具（如Cursor）集成。

5.9k

Patchright Stealth Browser

Patchright Lite MCP Server是一个轻量级的浏览器自动化服务，基于Patchright Node.js SDK构建，通过Model Context Protocol为AI模型提供隐身的网页浏览和交互能力。

12.9k

Axone Mcp

Axone的MCP服务器是一个轻量级实现，通过标准化的模型上下文协议（MCP）暴露Axone的能力，作为AI工具访问数据宇宙的网关。

7.6k

MCPollinations

MCPollinations是一个基于Model Context Protocol（MCP）的多模态AI服务，支持通过Pollinations API生成图像、文本和音频。它提供无需认证的轻量级服务，兼容多种AI模型，并支持图像保存和Base64编码返回。

javascript

Neon PostgreSQL

一个轻量级的模型控制协议(MCP)服务器，用于通过Cursor等代理工具与Neon REST API交互，部署在Cloudflare Workers上。

Hydra Penetration Testing Toolkit

HydraMCP是一个轻量级、可扩展的网络安全工具包，通过模型上下文协议（MCP）将AI助手与安全工具连接，支持AI辅助的安全研究、扫描和分析。

10.1k

Cloudera Ai Agent Studio Mcp

Cloudera AI Agent Studio MCP Server是一个轻量级的模型上下文协议桥接服务，可将Agent Studio实例暴露为一组可调用的工具，支持动态创建和管理工作流。

35.8k

Code Analysis Server

一个基于MCP协议的代码分析服务器，通过自然语言对话帮助AI模型理解和分析代码库，提供轻量级的代码探索与理解功能。

6.7k

Otter Bridge

OtterBridge是一个轻量级的MCP服务器，用于连接应用程序与多种大型语言模型提供商，支持Ollama等模型，设计简洁灵活。

7.8k

Mcp Crew Ai

MCP Crew AI Server是一个基于Python的轻量级服务器，用于运行和管理CrewAI工作流，支持通过MCP协议与大型语言模型通信。

8.6k

Mcp Bridge Api

MCP Bridge是一个轻量级、与LLM无关的RESTful代理，用于连接多个模型上下文协议（MCP）服务器，并通过统一的REST API暴露其功能。它解决了边缘设备、移动设备和Web浏览器等平台无法高效运行MCP服务器的问题，提供了可选的基于风险的执行级别，包括标准执行、确认工作流和Docker隔离等安全控制。