最好的AI推理 AI工具模型_精选AI推理资讯

AI资讯

Paytm 与 Groq 合作，推动高性能 AI 模型发展

印度支付巨头Paytm与美国硬件公司Groq合作，将利用GroqCloud云端服务提升AI模型性能，优化交易处理、风险评估、欺诈检测和消费者互动。GroqCloud基于自主研发的语言处理单元，专注于AI推理，旨在增强Paytm平台的智能化水平。

5.4k 3 小时前

微软 Azure ND GB300 再创记录：每秒推理速度达 110 万token

微软Azure ND GB300v6虚拟机在Llama270B模型上创下每秒110万token推理速度新纪录。该成就基于与英伟达的深度合作，采用配备72个Blackwell Ultra GPU和36个Grace CPU的NVIDIA GB300NVL72系统，突显微软在规模化AI运算领域的专业实力。

9.7k 16 小时前

微软 Azure ND GB300 再创记录：每秒推理速度达 110 万token

蚂蚁数科推出多语种视觉大模型训练框架，高效识别文档伪造与逻辑矛盾

蚂蚁数科在香港金融科技节推出“多语种多模态大模型训练框架”，旨在解决大模型在多语言环境的应用瓶颈。传统英文大模型在小语种中易出现语言错乱和推理混乱，限制全球化发展。该框架通过优化多语种处理能力，提升模型在多样化语言环境下的表现，推动AI技术更广泛高效地服务于全球各行业。

8.9k 34 分钟前

美的发布新一代 Home AI 系统:打造“能思考”的智能家居中枢

在美的“远见者大会”上，徐翼介绍了新一代AI交互系统Home AI。该系统通过“连接—感知—推理—执行”闭环，实现智能联动家电设备，并基于用户习惯自动优化，提升人机交互体验。

9.9k 44 分钟前

AI产品

Nano Banana 2

Google基于Gemini 3 Pro的AI图像编辑器，推理强，生成编辑能力出色

图片生成

4.7k

Luma Ray3AI

全球首个推理AI视频模型Ray3，可从文本提示创建4K HDR视频

视频生成

6.7k

Ray3

全球首个带推理智能与16位HDR输出的AI视频模型，创作高效专业

视频生成

6.3k

Ray 3

Ray 3 AI将文本转化为4K HDR视频，具备智能推理和多种特色功能。

视频生成

5.4k

模型

DeepSeek R1 0528 (May '25)

deepseek

$3.6

输入tokens/百万

$15.48

输出tokens/百万

128k

上下文长度

Gemini 2.5 Flash Preview (May '25) (Reasoning)

google

$2.16

输入tokens/百万

$18

输出tokens/百万

上下文长度

Claude 4 Opus (Extended Thinking)

anthropic

$108

输入tokens/百万

$540

输出tokens/百万

200k

上下文长度

GLM-4.5

chatglm

$0.43

输入tokens/百万

$1.01

输出tokens/百万

131.1k

上下文长度

MiniMax M1 80k

minimax

输入tokens/百万

输出tokens/百万

上下文长度

MiniMax M1 40k

minimax

输入tokens/百万

输出tokens/百万

上下文长度

Kimi K2

moonshotai

$4.1

输入tokens/百万

$16.56

输出tokens/百万

128k

上下文长度

Grok 3 Reasoning Beta

xai

$21.6

输入tokens/百万

$108

输出tokens/百万

上下文长度

Gemini 2.5 Flash

google

$2.16

输入tokens/百万

$18

输出tokens/百万

上下文长度

Claude 4 Sonnet

anthropic

$21.6

输入tokens/百万

$108

输出tokens/百万

200k

上下文长度

DeepSeek R1 0528 Qwen3 8B

deepseek

$3.6

输入tokens/百万

$15.48

输出tokens/百万

128k

上下文长度

Solar Pro 2 (Preview) (Reasoning)

upstage

输入tokens/百万

输出tokens/百万

64k

上下文长度

Grok 3

xai

$21.6

输入tokens/百万

$108

输出tokens/百万

上下文长度

Gemini 2.0 Pro Experimental (Feb '25)

google

输入tokens/百万

输出tokens/百万

上下文长度

Reka Flash 3

reka-ai

输入tokens/百万

输出tokens/百万

128k

上下文长度

Solar Pro 2

upstage

输入tokens/百万

输出tokens/百万

65.5k

上下文长度

Claude Opus 4.1

anthropic

$108

输入tokens/百万

$540

输出tokens/百万

200k

上下文长度

Gemini 2.5 Flash-Lite

google

$0.72

输入tokens/百万

$2.88

输出tokens/百万

上下文长度

GLM-4-Plus

智谱ai

$4.5

输入tokens/百万

$22.5

输出tokens/百万

128k

上下文长度

Claude 3.5 Sonnet (Oct '24)

anthropic

输入tokens/百万

输出tokens/百万

200k

上下文长度

MCP

Perplexity Research Assistant

Perplexity MCP Server是一个智能研究助手，利用Perplexity的AI模型自动分析查询复杂度并选择最佳模型处理请求，支持搜索、推理和深度研究三种工具。

typescript

16.8k

4.5分

Perplexity Mcp

Perplexity MCP Server是一个智能研究助手，利用Perplexity的AI模型提供自动查询复杂度检测和最优模型路由功能，支持搜索、推理和深度研究三种工具。

typescript

8.9k

3.5分

RAT (Retrieval Augmented Thinking)

结合DeepSeek推理与Claude生成的两阶段AI对话服务

typescript

27.4k

3.0分

Mindmesh Mcp Server

一个基于量子场计算模型的Claude多实例协同推理服务器，通过场一致性优化实现增强型AI推理能力。

typescript

6.5k

2.5分

Think Mcp

Think MCP是一个实现MCP服务器的项目，提供'think'工具以支持AI代理在复杂任务中进行结构化推理，灵感来自Anthropic的研究。该工具通过记录思考过程帮助AI处理信息、回溯或遵守策略，适用于工具输出分析、策略密集环境和顺序决策场景。

python

6.3k

2.5分

Perplexity Mcp Server N01

Perplexity MCP Server是一个用Go编写的中间件服务器，为AI助手（如Claude和Cursor）提供无缝访问Perplexity API的能力，包括实时搜索和复杂推理功能。

9.4k

2.5分

GemForge (Google Gemini)

已认证

GemForge是将Google的Gemini AI与MCP生态系统连接的企业级工具，提供实时网络访问、高级推理、代码分析和多文件处理等功能，支持60多种文件格式，具备智能模型选择和强大的错误处理机制。

typescript

3.4k

2.5分

Retrieval Augmented Thinking

一个增强AI模型推理能力的MCP服务器，通过结构化检索和动态思维链提升问题解决能力。

typescript

2.5分

Deepseek Reasoner

一个由Claude构建的DeepSeek推理服务项目

python

26.7k

2.5分

Mcp Reasoning Server

一个为Cursor AI中的Claude提供高级推理能力的MCP服务器，包含多种推理方法如蒙特卡洛树搜索、束搜索和Transformer混合推理等。

javascript

30.5k

2.5分

Smart Thinking

Smart-Thinking是一个先进的MCP服务器，提供多维、自适应且可自验证的AI推理框架，采用基于图形的架构实现复杂思维连接，支持跨平台运行并与多种MCP客户端兼容。

typescript

6.8k

2.5分

ChatGPT_MCP

该项目是一个基于Model Context Protocol (MCP)的stdio服务器，用于将提示转发至OpenAI的ChatGPT (GPT-4o)，支持高级摘要、分析和推理功能，适用于LangGraph框架的助手集成。

python

38.3k

2.5分

Think Mcp Server

基于Anthropic研究的MCP服务器，为Claude AI提供'think'工具能力，增强复杂推理任务处理。

typescript

7.4k

2.5分

GemForge MCP

GemForge是将谷歌Gemini AI与MCP生态系统连接的企业级工具，提供实时网络访问、高级推理、代码分析和多文件处理等功能，支持60多种文件格式，具备智能模型选择和强大的错误处理机制。

typescript

6.8k

2.5分

Advanced Reason Mcp

基于Gemini API的高级推理与反思工具，支持多模型集成与自定义配置

typescript

4.5k

2.5分

Mcp Server Replicate

一个基于Replicate API的FastMCP服务器实现，专注于提供资源化的AI模型推理访问，特别擅长图像生成功能。

python

6.1k

2.5分

Deepseek Thinker Mcp

Deepseek Thinker MCP Server是一个提供Deepseek推理内容的MCP服务，支持OpenAI API和本地Ollama两种模式，可集成到AI客户端中。

typescript

2.5分

Smart Thinking

Smart-Thinking是一个先进的MCP服务器，提供多维、自适应且可自我验证的AI推理框架。

typescript

8.3k

2.5分

Mcp Thought Server

MCP Thought Server是一个为AI代理提供高级思维工具的服务，通过模型上下文协议（MCP）增强推理、规划和迭代优化能力。它包含结构化思维、迭代草稿和集成思维等工具，支持SQLite持久化和高级置信度评分系统，可配置环境变量以适应不同需求。

typescript

8.3k

2.5分

Mcp Dual Cycle Reasoner

MCP双循环推理器是一个为自主AI代理设计的元认知增强工具，通过双循环框架（哨兵监控和裁决器管理）实现异常检测和经验学习，提升代理的自我意识和可靠性。

智启未来，您的人工智能解决方案智库

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

Paytm 与 Groq 合作，推动高性能 AI 模型发展

微软 Azure ND GB300 再创记录：每秒推理速度达 110 万token

蚂蚁数科推出多语种视觉大模型训练框架，高效识别文档伪造与逻辑矛盾

美的发布新一代 Home AI 系统:打造“能思考”的智能家居中枢

AI产品

Nano Banana 2

Luma Ray3AI

Ray3

Ray 3

模型

DeepSeek R1 0528 (May '25)

Gemini 2.5 Flash Preview (May '25) (Reasoning)

Claude 4 Opus (Extended Thinking)

GLM-4.5

MiniMax M1 80k

MiniMax M1 40k

Kimi K2

Grok 3 Reasoning Beta

Gemini 2.5 Flash

Claude 4 Sonnet

DeepSeek R1 0528 Qwen3 8B

Solar Pro 2 (Preview) (Reasoning)

Grok 3

Gemini 2.0 Pro Experimental (Feb '25)

Reka Flash 3

Solar Pro 2

Claude Opus 4.1

Gemini 2.5 Flash-Lite

GLM-4-Plus

Claude 3.5 Sonnet (Oct '24)

Qwen3 VL 2B Instruct GGUF

Thewhisper Large V3 Turbo

Thewhisper Large V3

Pokee_research_7b GGUF

LFM2 VL 3B

Pokee_research_7b

GLM 4.6 AWQ

GLM 4.6

GLM 4.6 GGUF

GLM 4.6

GLM 4.6 FP8

Qwen3 0.6B

Qwen3 32B FP4

Qwen3 14B FP4

Kimi K2 Instruct 0905 HQ4_K

Llama 3.1 8b Roleplay Airtel Gguf

Glm 0.5B Old

Luth LFM2 350M

GLM 4.5 Air 3bit DWQ V2

GLM 4.5V AWQ 4bit

MCP

Perplexity Research Assistant

Perplexity Mcp

RAT (Retrieval Augmented Thinking)

Mindmesh Mcp Server

Think Mcp

Perplexity Mcp Server N01

GemForge (Google Gemini)

Retrieval Augmented Thinking

Deepseek Reasoner

Mcp Reasoning Server

Smart Thinking

ChatGPT_MCP

Think Mcp Server

GemForge MCP

Advanced Reason Mcp

Mcp Server Replicate

Deepseek Thinker Mcp

Smart Thinking

Mcp Thought Server

Mcp Dual Cycle Reasoner