Best 模型部署 AI Tools & Models - Premium 模型部署 News

AI News

亚马逊 SageMaker已部署 Mistral AI 的 Voxtral 模型

Mistral AI推出Voxtral系列模型，整合文本与音频处理能力。该系列包括Voxtral-Mini-3B-2507和Voxtral-Small-24B-2507两款。前者为3亿参数模型，适合快速音频转录和基础多模态理解；后者拥有240亿参数，支持复杂音频文本智能和多语言处理，适用于企业级应用。两款模型均支持30至40分钟音频上下文处理。

6.1k 5 hours ago

美的医疗发布国产医学影像大模型：胸部DR病种“一键诊断”，双量级架构兼顾端云部署

美的集团旗下美的医疗推出自主知识产权“医学影像多模态智能诊断大模型”，实现AI医疗关键突破。该模型可一次性自动检测肺结核、肺炎、气胸、骨折等常见胸部疾病，并生成结构化诊断报告，显著提升基层医疗机构阅片效率与诊断一致性。

9.3k 5 hours ago

普惠算力新解法：英博云如何通过 K8S 原生架构降低 AI 研发门槛

大模型时代，算力需求激增，但中小企业与科研机构面临GPU获取难题：本地部署成本高、维护难；传统云服务配置复杂、调度不灵活。需探索更经济、灵活的算力解决方案。

9.9k 13 hours ago

OpenAI 牵手埃森哲推出企业级 AI 旗舰计划，数万名顾问率先部署 ChatGPT Enterprise

OpenAI与埃森哲达成战略合作，将为企业提供一站式AI转型方案。埃森哲7万名顾问将配备ChatGPT Enterprise，双方将共同开发行业专用大模型与数据平台。合作覆盖医疗、金融、制造和公共部门，提供从AI战略咨询到模型部署的全流程服务。消息公布后，埃森哲股价盘前上涨超5%，市值一度增加超70亿美元。

6.3k 2 days ago

AI Products

Hathora

提供语音AI的ASR、TTS和LLM模型，可测试部署用于实时应用。

开发平台

8.7k

Nexa SDK

Nexa SDK可在数分钟内将AI模型部署到任何设备上，快速、私密且适用于多场景。

模型训练与部署

6.4k

SiliconFlow

为开发者提供快速的AI平台，部署、优化和运行200多个LLM和多模型。

模型训练与部署

6.8k

Radal

Radal是一个无代码平台，可使用您自己的数据微调小型语言模型。连接数据集，通过可视化配置训练，并在几分钟内部署模型。

模型训练与部署

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Fastapi_mcp

FastAPI-MCP是一个将FastAPI端点作为模型上下文协议(MCP)工具暴露的库，内置认证功能，支持灵活部署和ASGI传输。

python

15.5k

5.0points

Mcp Atlassian

MCP Atlassian是一个为Atlassian产品（Confluence和Jira）设计的模型上下文协议服务器，支持云端和本地部署，提供AI助手集成功能。

python

14.3k

5.0points

Xiyan Mcp Server

XiYan MCP Server是一个基于XiYan-SQL的模型上下文协议服务器，支持通过自然语言查询数据库，提供多种LLM模型配置和数据库连接方式，适用于本地或远程部署。

python

9.7k

3.0points

XiYanSQL (MySQL)

XiYan MCP Server是一个基于XiYan-SQL的模型上下文协议服务器，支持通过自然语言查询数据库，提供多种LLM模型集成和本地化部署选项。

python

11.5k

3.0points

Netlify Mcp

Netlify MCP Server是一个遵循模型上下文协议（MCP）的服务，它允许代码代理通过自然语言指令使用Netlify API和CLI来创建、构建、部署和管理Netlify资源。

typescript

6.7k

2.5points

Mcp Cyclops

Cyclops MCP是一个允许AI代理通过模型上下文协议安全管理和部署Kubernetes应用的工具，提供模板验证和应用创建/更新功能

2.5points

NextChat MCP

NextChat的定制版本，通过聊天交互创建和部署MCP服务器，集成OpenRouter的LLM模型，提供工具提取、一键部署和AI系统集成指南功能。

typescript

10.4k

2.5points

Mcp_server_ros_2

WiseVision ROS2 MCP服务器是一个基于Python的ROS2模型上下文协议(MCP)实现，提供ROS2主题和服务管理、消息订阅发布、数据黑盒访问等功能，支持通过Docker容器化部署。

python

8.3k

2.5points

Workos Mcp

这是一个基于Cloudflare Workers的轻量级模型控制协议(MCP)服务器，用于让代理（如Cursor代理）与WorkOS API交互。项目提供自动化部署和工具扩展功能。

typescript

9.5k

2.5points

Neon PostgreSQL

一个轻量级的模型控制协议(MCP)服务器，用于通过Cursor等代理工具与Neon REST API交互，部署在Cloudflare Workers上。

typescript

9.9k

2.5points

Devops Mcp Servers

该项目是一个专为DevOps工具和平台设计的Model Context Protocol (MCP)服务器集合，通过标准化方式让大型语言模型(LLM)直接与主流DevOps系统交互，实现基础设施、部署流水线、监控等操作的自动化控制。

python

6.8k

2.5points

Layer2 Mcp

一个基于Model Context Protocol的以太坊Layer2网络交互服务器，为AI模型提供标准化接口，支持代币部署、交易管理和跨链操作。

typescript

6.1k

2.5points

Swarms API MCP Server

Swarms API 是一个用于构建、部署和管理多智能体系统的REST API，支持多种AI模型和群架构，提供实时监控、批量处理和任务调度等功能。

python

39.7k

2.5points

Socket Mcp

Socket MCP服务器是一个用于依赖项安全扫描的模型上下文协议服务，提供npm、PyPI等软件包生态系统的安全评分和漏洞检测功能，支持AI助手集成和多种部署方式。

typescript

2.5points

Pluggedin App

plugged.in App是一个用于管理模型上下文协议(MCP)服务器的综合Web应用，提供统一界面来发现、配置和使用跨多个MCP服务器的AI工具。它支持多工作区、交互式测试平台、工具管理、资源发现等功能，可与各种MCP客户端集成，并支持自托管部署。

typescript

8.7k

2.5points

BuildMCPServer

该项目提供了一套完整的MCP服务器构建指南，用于部署训练好的随机森林模型，并与Bee框架集成实现ReAct交互功能。

python

8.8k

2.5points

Pop Mcp

Pop MCP Server 是一个为 Polkadot 生态提供全面开发支持的模型上下文协议服务器，集成了 Pop CLI 工具链，支持智能合约、平行链、运行时模块的创建、构建、测试和部署，并提供完整的 Polkadot、ink! 和 XCM 文档资源，让开发者能够通过自然语言与 AI 助手交互完成整个开发流程。

rust

7.7k

2.5points

Mcp Palette

MCP Palette是一款用于管理Model Context Protocol服务器配置的桌面应用程序，提供集中式界面来配置、管理和部署用于大型语言模型的MCP服务器。

javascript

7.7k

2.5points

Mcp Server Template (python) 9f0

一个用于快速构建模型上下文协议(MCP)服务器的Python模板项目，提供工具和提示的注册与暴露功能，支持多种部署方式。

python

8.6k

2.5points

Teamspeak Mcp

TeamSpeak MCP是一个基于Model Context Protocol的服务器控制工具，专门用于让AI模型（如Claude）管理TeamSpeak语音服务器。它提供39种功能工具，涵盖用户管理、频道控制、权限配置等全方位操作，支持多种部署方式（PyPI/Docker/本地），实现自动化TeamSpeak管理。

python

7.4k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

​亚马逊 SageMaker已部署 Mistral AI 的 Voxtral 模型

美的医疗发布国产医学影像大模型：胸部DR病种“一键诊断”，双量级架构兼顾端云部署

普惠算力新解法：英博云如何通过 K8S 原生架构降低 AI 研发门槛

OpenAI 牵手埃森哲推出企业级 AI 旗舰计划，数万名顾问率先部署 ChatGPT Enterprise

AI Products

Hathora

Nexa SDK

SiliconFlow

Radal

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

Qianfan-Lightning

wan2.5-i2i-preview

qwen-image-edit

Qwen.Qwen3 VL 32B Thinking GGUF

GPT OSS Cybersecurity 20B Merged I1 GGUF

Hermes 4.3 36B GGUF

Llama 3 8b Bnb 4bit GGUF

Qwen3 Next 80B A3B Instruct 4bit SINQ

GigaChat3 10B A1.8B GGUF

Kldzj_gpt Oss 120b Heretic V2 GGUF

Qwen3 4B Thinking 2507 GGUF

Cerebras.MiniMax M2 REAP 172B A10B GGUF

MiniMax M2 REAP 172B A10B MXFP4_MOE GGUF

RealRobot Chatbot Ecommerce Robot Fibonacci Nano Llm

WeiboAI.VibeThinker 1.5B GGUF

Qwen3 Coder 30B A3B Instruct F32

NV Reason CXR 3B GGUF

YanoljaNEXT Rosetta 4B 2511 I1 GGUF

Qwen3 VL 8B Instruct 1M GGUF

Qwen3 VL 2B Instruct 1M GGUF

Embeddinggemma 300m Gguf

Gelato 30B A3B GGUF

ChronoEdit 14B GGUF

MCP

Fastapi_mcp

Mcp Atlassian

Xiyan Mcp Server

XiYanSQL (MySQL)

Netlify Mcp

Mcp Cyclops

NextChat MCP

Mcp_server_ros_2

Workos Mcp

Neon PostgreSQL

Devops Mcp Servers

Layer2 Mcp

Swarms API MCP Server

Socket Mcp

Pluggedin App

BuildMCPServer

Pop Mcp

Mcp Palette

Mcp Server Template (python) 9f0

Teamspeak Mcp

亚马逊 SageMaker已部署 Mistral AI 的 Voxtral 模型