最好的模型部署 AI工具模型_精選模型部署資訊

AI資訊

騰訊混元發佈1.5版開源翻譯模型:端側部署性能躍升，效果比肩超大型閉源模型

騰訊混元開源翻譯模型1.5版本，推出1.8B和7B兩個尺寸模型，主打高效與高質量翻譯，優化端雲協同體驗。其中1.8B模型專爲手機等設備設計，量化後僅需1GB內存即可離線流暢運行，實現端側部署與卓越性能。

16k 4 小時前

階躍星辰推出高性價比深度研究模型 Step-DeepResearch

階躍星辰開源320億參數深度研究模型Step-DeepResearch，能在開放環境中自主探索信息並生成專業報告。其研究能力接近OpenAI o3-mini等頂級商業模型，但部署成本僅爲傳統模型的十分之一，單次調用成本低於0.5元人民幣。

11.3k 3 小時前

亞馬遜 SageMaker已部署 Mistral AI 的 Voxtral 模型

Mistral AI推出Voxtral系列模型，整合文本與音頻處理能力。該系列包括Voxtral-Mini-3B-2507和Voxtral-Small-24B-2507兩款。前者爲3億參數模型，適合快速音頻轉錄和基礎多模態理解；後者擁有240億參數，支持複雜音頻文本智能和多語言處理，適用於企業級應用。兩款模型均支持30至40分鐘音頻上下文處理。

9.6k 6 小時前

美的醫療發佈國產醫學影像大模型：胸部DR病種“一鍵診斷”，雙量級架構兼顧端雲部署

美的集團旗下美的醫療推出自主知識產權“醫學影像多模態智能診斷大模型”，實現AI醫療關鍵突破。該模型可一次性自動檢測肺結核、肺炎、氣胸、骨折等常見胸部疾病，並生成結構化診斷報告，顯著提升基層醫療機構閱片效率與診斷一致性。

9.8k 1 天前

AI產品

Hathora

提供語音AI的ASR、TTS和LLM模型，可測試部署用於即時應用。

開發平臺

6.5k

Nexa SDK

Nexa SDK可在數分鐘內將AI模型部署到任何設備上，快速、私密且適用於多場景。

模型訓練與部署

6.6k

SiliconFlow

為開發者提供快速的AI平臺，部署、優化和運行200多個LLM和多模型。

模型訓練與部署

7.4k

Radal

Radal是一個無代碼平臺，可使用您自己的數據微調小型語言模型。連接數據集，通過可視化配置訓練，並在幾分鐘內部署模型。

模型訓練與部署

5.2k

模型

Gemini 2.0 Flash-Lite

Google

$0.49

輸入tokens/百萬

$2.1

輸出tokens/百萬

上下文長度

GPT-4.1 mini

Openai

$2.8

輸入tokens/百萬

$11.2

輸出tokens/百萬

上下文長度

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Claude 3 Sonnet

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

wan2.5-i2i-preview

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-vl-plus

Alibaba

輸入tokens/百萬

$10

輸出tokens/百萬

256

上下文長度

qwen-image-plus

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen3-vl-235b-a22b-thinking

Alibaba

輸入tokens/百萬

$20

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

Qianfan-Lightning

Baidu

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Doubao-Seed-Translation

Bytedance

$1.2

輸入tokens/百萬

$3.6

輸出tokens/百萬

上下文長度

MCP

Mcp

微軟官方MCP服務器集合，提供Azure、GitHub、Microsoft 365、Fabric等多種服務的AI助手集成工具，支持本地和遠程部署，幫助開發者通過標準化協議連接AI模型與各類數據源和工具。

csharp

6.7k

5.0分

Mcp Atlassian

MCP Atlassian是一個為Atlassian產品（Confluence和Jira）設計的模型上下文協議服務器，支持雲端和本地部署，提供AI助手集成功能。

python

13.4k

5.0分

Fastapi_mcp

FastAPI-MCP是一個將FastAPI端點作為模型上下文協議(MCP)工具暴露的庫，內置認證功能，支持靈活部署和ASGI傳輸。

python

14.8k

5.0分

XiYanSQL (MySQL)

XiYan MCP Server是一個基於XiYan-SQL的模型上下文協議服務器，支持通過自然語言查詢數據庫，提供多種LLM模型集成和本地化部署選項。

python

9.7k

3.0分

Xiyan Mcp Server

XiYan MCP Server是一個基於XiYan-SQL的模型上下文協議服務器，支持通過自然語言查詢數據庫，提供多種LLM模型配置和數據庫連接方式，適用於本地或遠程部署。

python

8.6k

3.0分

Layer2 Mcp

一個基於Model Context Protocol的以太坊Layer2網絡交互服務器，為AI模型提供標準化接口，支持代幣部署、交易管理和跨鏈操作。

typescript

6.7k

2.5分

Mcp Hub Documentation

MCP Hub是一個用於創建和管理模型上下文協議（MCP）服務器與客戶端的框架，集成了UV工具以簡化包管理和配置。項目包含AI相關的計算機視覺腳本和數據集處理工具，支持快速部署和開發。

python

6.6k

2.5分

Tiangong Ai Mcp

天工AI模型上下文協議(MCP)服務器，支持多種通信協議，包括STDIO和Streamable Http，提供便捷的部署和開發支持。

typescript

9.6k

2.5分

Mcsmcp

本實驗指導用戶如何部署MCP服務器並將其集成到Microsoft Copilot Studio中，通過標準化協議連接AI模型與數據源，實現即時數據訪問和笑話生成功能。

typescript

7.9k

2.5分

Oauth2 Authorization Server

一個基於Spring Boot 3和Java 24的OAuth2授權服務器項目，支持GraalVM原生鏡像、CRaC檢查點恢復、本地AI模型測試及Docker部署。

java

6.4k

2.5分

Trellis_mcp

Trellis MCP是一個連接AI助手與Trellis 3D生成模型的接口服務，支持通過自然語言快速生成3D資產並導入Blender。該項目基於開源模型，需自行部署API後端，具有快速、免費的特點，但存在穩定性風險。

python

6.3k

2.5分

Mcp Palette

MCP Palette是一款用於管理Model Context Protocol服務器配置的桌面應用程序，提供集中式界面來配置、管理和部署用於大型語言模型的MCP服務器。

javascript

7.2k

2.5分

Hostbridge Mcp

Arc MCP Server是一個簡化框架部署的模型上下文協議服務器，專注於共享託管環境，支持多平臺部署和引導式操作。

python

6.2k

2.5分

Swarms API MCP Server

Swarms API 是一個用於構建、部署和管理多智能體系統的REST API，支持多種AI模型和群架構，提供即時監控、批量處理和任務調度等功能。

python

9.7k

2.5分

Prometheus Mcp Server

一個為Prometheus提供模型上下文協議(MCP)接口的服務，支持執行PromQL查詢、探索指標數據，並提供認證和容器化部署支持。

python

8.2k

2.5分

Apple Health Mcp Server

Apple Health MCP Server是一個基於FastMCP框架的模型上下文協議服務器，專為LLM代理與蘋果健康數據交互設計。它提供標準化接口，通過Elasticsearch索引和查詢健康數據，支持自然語言搜索、分析和統計功能，包含XML和Elasticsearch兩大工具集，支持Docker部署。

python

8.5k

2.5分