Best 大语言模型 AI Tools & Models - Premium 大语言模型 News

AI News

目标“真·AI个人助理”:苹果开办内部训练营，详解 Siri 进化底座

苹果公司为Siri工程师团队启动“AI编程训练营”，通过系统性再培训提升其大语言模型工程能力，以支持新一代Siri和iOS系统AI功能开发。此举表明苹果已将AI重塑Siri提升至公司战略高度，旨在追赶谷歌和OpenAI在生成式AI领域的进展。培训内容涵盖模型原理到工程部署全链路，重点聚焦Prompt工程。

9.7k 1 hours ago

谷歌 AI 研究推出 Vantage：基于大语言模型的协作与创造力测评新方法

谷歌研究团队推出Vantage方法，利用大语言模型模拟真实团队互动，旨在测量传统测试难以评估的协作、创造力和批判性思维等“持久技能”，弥补教育领域长期缺乏有效评估工具的不足。

12.5k 2 hours ago

AI医疗进入“深水区”:研究指生成式模型尚难独立承担临床推理重任

研究显示，当前主流AI模型在模拟临床诊疗推理时仍存在明显不足，尚不具备独立承担医疗任务的能力。该研究测试了21种大语言模型，结果发表于《JAMA Network Open》。

13.4k 29 minutes ago

腾讯发布 HY-Embodied-0.5具身模型，22项评测16项最佳刷新行业纪录

腾讯推出专为机器人打造的HY-Embodied-0.5基础模型，旨在解决通用视觉语言模型在三维空间感知和物理交互方面的不足，推动大模型向机器人控制领域延伸。该系列模型从架构到训练均进行了重构，并同步发布MoT-2B等主力模型。

22.5k 1 hours ago

腾讯发布 HY-Embodied-0.5具身模型，22项评测16项最佳刷新行业纪录

AI Products

clawpk

一切龙虾的始祖，支持多平台和大模型，完全开源。

智能体

6.5k

TokenHot

统一大语言模型API网关，支持超30家提供商，价优稳定免订阅

API服务

Respan

Respan是统一可观测性、评估、提示优化和LLM网关的工程平台。

开发平台

5.5k

Manifest

开源LLM路由器，路由请求到最具成本效益模型，节省70% AI令牌成本。

开发与工具

3.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Supabase Mcp

Supabase MCP Server是一个连接Supabase项目与AI助手的工具，通过Model Context Protocol（MCP）标准化大型语言模型（LLMs）与外部服务的交互，实现数据库管理、配置获取和数据查询等功能。

typescript

34.2k

5.0points

Jinni

Jinni是一个高效为大型语言模型提供项目上下文的工具，通过整合相关文件及其元数据，克服逐个文件读取的限制。

python

10.7k

3.5points

Mcp Engine

MCPEngine是一个生产级的Model Context Protocol (MCP)实现，为大型语言模型(LLM)提供标准化接口，支持OAuth认证、资源管理、工具调用等功能，旨在成为'LLM界的REST'框架。

python

10.4k

3.5points

LLM Code Context

LLM Context是一个帮助开发者快速将代码/文本项目内容注入大型语言模型聊天界面的工具，支持智能文件选择和多种集成方式。

python

11.4k

3.5points

Memory Knowledge Graph

一个基于Swift实现的知识图谱记忆服务器，为大型语言模型提供持久化记忆功能

swift

15.9k

3.0points

Rails Mcp Server

Rails MCP Server是一个基于Ruby实现的Model Context Protocol服务器，为Rails项目提供与大型语言模型交互的标准接口。

ruby

10.2k

3.0points

MCP2Lambda

MCP2Lambda是一个将AWS Lambda函数作为大型语言模型(LLM)工具运行的MCP协议服务器，无需修改代码即可让AI模型调用Lambda函数访问私有资源和AWS服务。

python

3.0points

WireMCP (Wireshark)

WireMCP是一个为大型语言模型(LLM)提供实时网络流量分析能力的MCP服务器，通过Wireshark工具捕获和处理网络数据，支持威胁检测、网络诊断和异常分析。

javascript

21.8k

3.0points

WireMCP

WireMCP是一个为大型语言模型（LLM）提供实时网络流量分析能力的MCP服务器，通过集成Wireshark工具实现数据捕获、威胁检测和网络诊断。

javascript

15.1k

3.0points

MCP2Lambda

MCP2Lambda是一个MCP服务器，允许将AWS Lambda函数作为大型语言模型(LLM)的工具使用，无需修改代码。它通过Model Context Protocol (MCP)在AI模型和Lambda函数之间建立桥梁，使模型能够访问私有资源和执行自定义操作。

python

14.6k

3.0points

Alpaca Mcp Server

Alpaca MCP服务器是一个实现Alpaca交易API的模型上下文协议(MCP)服务，允许大型语言模型通过自然语言与Alpaca交易系统交互，支持股票/期权交易、投资组合管理和实时市场数据获取。

python

10.1k

3.0points

Watsonx Rag Mcp Server

本项目构建了一个基于IBM Watsonx.ai的检索增强生成(RAG)服务器，使用ChromaDB进行向量索引，并通过模型上下文协议(MCP)暴露接口。该系统能够处理PDF文档并基于文档内容回答问题，实现了将大型语言模型与特定领域知识相结合的智能问答功能。

python

9.3k

2.5points

Firelinks Mcp

Firelinks MCP服务器是一个基于Model Context Protocol的API网关，允许大型语言模型通过标准化协议与Firelinks短链接平台进行交互，提供链接管理、统计分析和域名管理等功能

javascript

9.1k

2.5points

Jira Y9t

JIRA MCP服务器是一个为大型语言模型提供与JIRA交互能力的中间件服务，支持JQL搜索和问题详情获取。

javascript

10.9k

2.5points

Excel Bridge

基于Spring AI MCP框架的Excel文件读写服务，支持与大语言模型集成实现动态交互

java

11.9k

2.5points

Unity Mcp

Unity MCP服务器是一个基于C#的模型上下文协议（MCP）服务，用于连接Unity编辑器与外部大型语言模型（LLM）或云端AI代理，实现实时自动化与智能交互。

csharp

10.6k

2.5points

Mcp Server Logical Solver

MCP逻辑求解器是一个结合大型语言模型与形式化定理证明能力的强大推理系统，支持自然语言和一阶逻辑输入，通过Prover9/Mace4进行自动验证，并提供结构化推理和解释。

python

10.6k

2.5points

Code Graph Context

一个基于模型上下文协议（MCP）的服务器，通过构建代码知识图谱为大型语言模型提供TypeScript代码库的深度上下文理解。它使用AST分析解析代码，在Neo4j中构建全面的图表示，并通过语义搜索和图遍历提供智能查询能力。

typescript

8.2k

2.5points

Mcp Graphql Schema

一个为大型语言模型提供GraphQL模式探索服务的MCP服务器，支持加载、查询和分析GraphQL模式文件。

开发者工具

9.8k

2.5points

ClickUp

一个提供与ClickUp工作空间无缝集成的MCP服务器，允许大型语言模型通过多种工具管理任务、文档和自定义字段。

typescript

13.3k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

目标“真·AI个人助理”:苹果开办内部训练营，详解 Siri 进化底座

谷歌 AI 研究推出 Vantage：基于大语言模型的协作与创造力测评新方法

AI医疗进入“深水区”:研究指生成式模型尚难独立承担临床推理重任

腾讯发布 HY-Embodied-0.5具身模型，22项评测16项最佳刷新行业纪录

AI Products

clawpk

TokenHot

Respan

Manifest

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

qwen3-max

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

wan2.5-t2v-preview

GPT OSS Cybersecurity 20B Merged I1 GGUF

TheDrummer_Magidonia 24B V4.3 GGUF

TheDrummer_Cydonia 24B V4.3 GGUF

Qwen3 4B Hivemind Instruct NEO MAX Imatrix GGUF

Mistralai_Mistral Large 3 675B Instruct 2512 GGUF

Ministral 3 3B Instruct 2512

Hugston Microsoft Fara 7B

Kimi Linear 48B A3B Instruct Mlx Bf16

GLM 4.5 Air Derestricted Qx53g Mlx

Qwen3 Next 80B A3B Instruct 4bit SINQ

GLM 4.5 Air REAP 82B A12B Mxfp4 Mlx

Olmo 3 7B Instruct 8bit

Ai Sage.GigaChat3 702B A36B Preview Bf16 GGUF

Qwen3 4B Thinking 2507 GGUF

Gemma 3 270M Model Router

Deepmath V1

Sarashina2.2 Vision 3b

Cerebras_MiniMax M2 REAP 172B A10B GGUF

Cerebras_MiniMax M2 REAP 139B A10B GGUF

Cerebras.MiniMax M2 REAP 172B A10B GGUF

MCP

Supabase Mcp

Jinni

Mcp Engine

LLM Code Context

Memory Knowledge Graph

Rails Mcp Server

MCP2Lambda

WireMCP (Wireshark)

WireMCP

MCP2Lambda

Alpaca Mcp Server

Watsonx Rag Mcp Server

Firelinks Mcp

Jira Y9t

Excel Bridge

Unity Mcp

Mcp Server Logical Solver

Code Graph Context

Mcp Graphql Schema

ClickUp