Best 大型AI模型 AI Tools & Models - Premium 大型AI模型 News

AI News

跨数据中心的创新：Moonshot AI 与清华大学提出 PrfaaS 架构

Moonshot AI与清华大学提出预填充即服务（PrfaaS）新架构，旨在解决大型语言模型推理中计算资源瓶颈。该架构将高计算密集的预填充阶段（生成键值缓存）与解码阶段分离，以优化资源利用，突破传统服务限制。

12k 3 hours ago

AI 潜意识竟会“隔空传毒”！Nature 重磅论文揭秘：AI 不良特征藏在纯数字里，蒸馏模型安全链彻底失守

Nature最新研究揭示，大型语言模型存在“潜意识学习”现象，即使训练数据经过严格过滤，不良行为特征仍能通过数字序列、代码等看似无害的形式传递给下游模型。这暴露了“模型蒸馏”技术可能放大上游模型的隐性风险，AI安全面临新挑战。

12.6k 1 hours ago

谷歌 Gemma 4 全面开源：小型模型展现超强 AI 能力

谷歌发布Gemma4系列开源模型，实现AI能力轻量化突破。其中一款仅激活3.8亿参数，性能却超越参数规模20倍的大型模型，使强大AI可轻松部署于手机和轻薄笔记本。该系列包含2.3B和4.5B等不同参数规模的模型，推动人工智能服务更便捷普及。

12.7k yesterday

农业 AI 的“GPT 时刻”:Carbon Robotics 发布大型植物模型 LPM

Carbon Robotics推出“大型植物模型”AI，作为激光除草机器人LaserWeeder的智能核心。该模型基于15个国家、100多个农场超1.5亿张高质量图像训练，具备深度植物结构理解能力，显著提升农田除草效率。

9.9k 20 hours ago

农业 AI 的“GPT 时刻”:Carbon Robotics 发布大型植物模型 LPM

AI Products

Deep Research Web UI

一个支持DeepSeek R1的AI驱动研究助手，结合搜索引擎、网络爬虫和大型语言模型进行深度研究。

研究工具

12.2k

EXAONE-3.5-32B-Instruct-GGUF

LG AI Research开发的多语言、高性能大型语言模型

AI模型

9.3k

Automated-AI-Web-Researcher-Ollama

自动化AI网络研究助手，利用本地大型语言模型进行深入研究。

研究工具

9.1k

Qwen2.5-Coder-14B-Instruct-AWQ

开源代码生成与推理的大型语言模型

AI模型

11.2k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Supabase Mcp

Supabase MCP Server是一个连接Supabase项目与AI助手的工具，通过Model Context Protocol（MCP）标准化大型语言模型（LLMs）与外部服务的交互，实现数据库管理、配置获取和数据查询等功能。

typescript

33.1k

5.0points

MCP2Lambda

MCP2Lambda是一个将AWS Lambda函数作为大型语言模型(LLM)工具运行的MCP协议服务器，无需修改代码即可让AI模型调用Lambda函数访问私有资源和AWS服务。

python

10.1k

3.0points

MCP2Lambda

MCP2Lambda是一个MCP服务器，允许将AWS Lambda函数作为大型语言模型(LLM)的工具使用，无需修改代码。它通过Model Context Protocol (MCP)在AI模型和Lambda函数之间建立桥梁，使模型能够访问私有资源和执行自定义操作。

python

15.7k

3.0points

Unity Mcp

Unity MCP服务器是一个基于C#的模型上下文协议（MCP）服务，用于连接Unity编辑器与外部大型语言模型（LLM）或云端AI代理，实现实时自动化与智能交互。

csharp

10.8k

2.5points

Mcp Code Mode

这是一个基于MCP协议的代码执行服务器原型，结合大型语言模型的代码生成能力和MCP工具集成，使AI代理能够在隔离沙箱中运行Python代码并调用外部工具。

python

9.7k

2.5points

Mcp Server 7v1

Firebolt MCP Server是一个实现模型上下文协议的服务，可将LLM（大型语言模型）与Firebolt数据仓库连接，使AI助手能够直接查询数据、生成洞察并访问文档资源。

9.9k

2.5points

Unity MCP

Unity-MCP是一个连接大型语言模型(LLM)与Unity编辑器的桥梁工具，通过暴露Unity编辑器功能给AI客户端，实现AI驱动的自动化开发流程。它支持自定义工具扩展，目前提供游戏对象管理、场景操作、资产处理等核心功能，主要适用于Unity编辑器环境。

csharp

15.4k

2.5points

Ols Mcp Server

OLS MCP服务器是一个为大型语言模型提供本体查询服务的工具，通过连接EBI本体查询服务API，帮助AI助手准确获取生物医学领域的本体术语、概念和层次结构。

python

6.9k

2.5points

Wanaku

Wanaku MCP路由器是一个基于模型上下文协议(MCP)的AI应用路由器，旨在标准化应用程序向大型语言模型(LLM)提供上下文的方式。

java

30.4k

2.5points

Generator

CTX是一款连接代码库与大型语言模型（LLM）的工具，通过自动化生成结构化上下文文件，解决AI开发中代码上下文传递效率低下的问题。支持从代码文件、Git仓库、网页等多种来源收集信息，并可通过MCP服务器直接为AI助手提供项目上下文。

php

21.7k

2.5points

Graphistry Mcp

该项目集成Graphistry的GPU加速图可视化平台与模型控制协议(MCP)，为AI助手和大型语言模型提供先进的图分析能力，支持多种数据格式和网络分析功能。

python

9.9k

2.5points

Lisp Dev Mcp

40ants-lisp-dev-mcp 是一个为大型语言模型（LLM）提供与运行中的Lisp镜像交互工具的MCP服务器。它支持通过stdio或HTTP流模式运行，允许LLM调用Lisp函数、获取文档、评估代码等，便于在Lisp开发环境中进行AI辅助编程。

开发者工具

6.9k

2.5points

Okta Mcp Server

Okta MCP Server 是一个基于 Model Context Protocol 的服务器，允许大型语言模型和AI代理通过自然语言指令管理Okta组织，支持用户、群组、应用程序、策略和日志等管理操作。

python

2.5points

Omnillm Mcp

OmniLLM是一个MCP服务器，作为Claude与其他大型语言模型（如ChatGPT、Azure OpenAI和Google Gemini）之间的桥梁，提供统一的AI访问接口。

人工智能聊天机器人

9.9k

2.5points

Clickhouse Mcp Server

该项目实现了一个ClickHouse的MCP服务器，用于将ClickHouse数据库与大型语言模型（LLMs）等AI应用无缝集成，支持查询数据库、获取表结构等功能。

python

11.2k

2.5points

MetaMask MCP

Verified

MetaMask MCP是一个模型上下文协议服务器，允许大型语言模型通过MetaMask与区块链交互，确保私钥安全存储在用户钱包中，不与AI代理共享。

typescript

8.6k

2.5points

Meta Api Mcp Server

Meta API MCP Server是一个支持多API的网关服务器，通过Model Context Protocol (MCP)协议连接各类API与大型语言模型（如Claude、GPT等），使AI助手能够直接与API交互并访问真实数据源。支持从JSON配置文件或Postman集合快速添加API，提供HTTP方法全面支持和多种认证方式。

javascript

9.8k

2.5points