谷歌DeepMind發佈多模態智能體SIMA2,基於Gemini2.5Flash-lite模型,任務成功率較前代提升約一倍。新版本能在陌生環境中執行復雜指令,具備自我改進能力,通過引入自生成數據循環機制:系統調用獨立Gemini模型在新場景中批量生成任務。目前以研究預覽形式發佈,旨在驗證實現通用人工智能所需的高階世界理解與推理能力。
百度在2025世界大會上發佈文心5.0大模型,參數量達2.4萬億。該模型採用原生全模態技術,能統一處理文本、圖像、音頻和視頻,具備出色的多模態理解、指令遵循、創意寫作和智能規劃能力,在推理與記憶方面表現突出。
Meta與新加坡國立大學合作開發SPICE強化學習框架,讓兩個AI代理相互對抗,在無人類監督下自我提升能力。該框架處於概念驗證階段,有望爲未來動態適應環境的AI系統奠定基礎,增強應對現實世界不可預測性的穩健性。
AMD於2025年11月11日收購AI推理初創公司MK1,旨在強化其在AI推理領域的戰略佈局。MK1的核心技術“Flywheel”與AMD的Instinct GPU深度優化,日處理超萬億token,顯著提升推理能力。收購後,MK1團隊將併入AMD AI事業部,助力公司鞏固市場地位。
Google基於Gemini 3 Pro的AI圖像編輯器,推理強,生成編輯能力出色
開放AI的GPT-OSS-120B和GPT-OSS-20B提供強大的推理能力,開發人員友好的功能,並採用Apache 2.0許可證,實現人工智能的民主化訪問。
GPT 5是下一代AI模型,提供卓越的編碼、數學和推理性能。
Grok 4是xAI推出的革命性AI模型,具備先進的推理能力、多模態功能和專業編碼特性。
google
$9
輸入tokens/百萬
$72
輸出tokens/百萬
1M
上下文長度
openai
$7.92
$31.68
200k
$2.16
$18
anthropic
$108
$540
chatglm
$0.43
$1.01
131.1k
$4.03
$7.99
128k
$432
nvidia
-
$21.6
deepseek
$3.96
$15.77
$15.98
alibaba
$0.72
moonshotai
$4.1
$16.56
$2.88
Mungert
aquif-3.5系列中的頂尖模型,具備先進推理能力和100萬標記的大上下文窗口,在多個基準測試中表現卓越,AAII綜合得分達到60分。
inferencerlabs
基於MLX庫實現的文本生成模型,支持多種量化方式推理,具備分佈式計算能力,可在蘋果硬件環境下高效運行。
mlx-community
Kimi-K2-Thinking 是由 mlx-community 從 moonshotai 原版模型轉換而來的 MLX 格式大語言模型,採用 mlx-lm 0.28.4 版本進行轉換,保留了原模型的思維鏈推理能力。
DavidAU
這是一個增強版的多模態視覺語言模型,基於Qwen3-VL-8B-Thinking模型,通過Brainstorm 20x技術擴展至12B參數,採用NEO Imatrix增強的GGUF量化。模型具備強大的圖像理解、文本生成和多模態推理能力,在視覺感知、文本質量和創意場景方面都有顯著提升。
unsloth
aquif-3.5系列是2025年11月3日發佈的巔峰之作,包含Plus和Max兩個版本,提供先進的推理能力和前所未有的100萬標記上下文窗口,在各自類別中實現了最先進的性能。
noctrex
Aquif-3.5-Max-42B-A3B是一個420億參數的大型語言模型,經過MXFP4_MOE量化處理,在保持高質量文本生成能力的同時優化了推理效率。該模型基於先進的混合專家架構,適用於多種自然語言處理任務。
Kimi K2 Thinking 是月之暗面(Moonshot AI)開發的最新一代開源思維模型,具有強大的深度推理能力和工具調用功能。該模型採用混合專家架構,支持原生INT4量化,擁有256k上下文窗口,在多個基準測試中表現出色。
Qwen3-VL是通義系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持、強大的空間和視頻動態理解能力以及出色的智能體交互能力。
慧慧Qwen3-VL-4B思維消除模型的量化版本,基於Qwen3-VL-4B模型進行優化,專門設計用於消除思維鏈推理過程,可搭配最新的llama.cpp使用,提供高效的圖像文本轉文本處理能力。
Qwen3-VL-32B-Thinking是Qwen系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文處理、空間和視頻動態理解能力,以及出色的智能體交互能力。
Qwen3-VL-8B-Thinking是通義千問系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持、強大的空間和視頻動態理解能力,以及出色的智能體交互能力。
Qwen3-VL是通義系列中最強大的視覺語言模型,在文本理解與生成、視覺感知與推理、上下文長度、空間和視頻動態理解以及智能體交互能力等方面全面升級。該模型提供密集架構和混合專家架構,支持從邊緣設備到雲端的靈活部署。
Qwen3-VL是Qwen系列中最強大的視覺語言模型,實現了全方位的綜合升級,包括卓越的文本理解與生成能力、更深入的視覺感知與推理能力、更長的上下文長度、增強的空間和視頻動態理解能力,以及更強的智能體交互能力。
GilbertAkham
這是一個基於DeepSeek-R1-Distill-Qwen-1.5B的多任務微調模型,通過LoRA適配器在多個數據集上進行訓練,具備強大的多任務泛化和推理能力,能夠處理廣泛的自然語言和基於推理的任務。
Qwen3-VL是Qwen系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持、強大的空間和視頻動態理解能力,以及出色的智能體交互能力。該版本為2B參數的思考增強版,專門優化了推理能力。
Qwen
Qwen3-VL-30B-A3B-Thinking是通義系列中最強大的視覺語言模型,具備出色的文本理解和生成能力、深入的視覺感知和推理能力、長上下文支持、強大的空間和視頻動態理解能力,以及智能體交互能力。
Qwen3-VL-30B-A3B-Instruct是通義系列中最強大的視覺語言模型,採用混合專家模型架構,具備出色的文本理解與生成能力、深入的視覺感知與推理能力,支持256K長上下文和視頻理解,可在多種設備上進行推理。
Qwen3-VL-2B-Thinking是Qwen系列中最強大的視覺語言模型之一,採用GGUF格式權重,支持在CPU、NVIDIA GPU、Apple Silicon等設備上進行高效推理。該模型具備出色的多模態理解和推理能力,特別增強了視覺感知、空間理解和智能體交互功能。
Qwen3-VL-8B-Thinking是通義千問系列中最強大的視覺語言模型,具備增強推理能力的8B參數版本。該模型在文本理解、視覺感知、空間理解、長上下文處理等方面全面升級,支持多模態推理和智能體交互。
Qwen3-VL是通義系列中最強大的視覺語言模型,具備出色的文本理解和生成能力、深入的視覺感知和推理能力、長上下文支持、強大的空間和視頻動態理解能力,以及智能體交互能力。本倉庫提供GGUF格式權重,支持在CPU、GPU等設備上高效推理。
MCP推理器是為Claude Desktop設計的增強推理能力的工具,提供波束搜索和蒙特卡洛樹搜索兩種算法,並新增實驗性策略模擬層以優化複雜問題解決。
MCP Reasoner是為Claude Desktop設計的推理增強工具,提供Beam Search和MCTS兩種搜索策略,通過實驗性算法提升複雜問題解決能力。
通過集成DeepSeek R1的推理引擎增強Claude的複雜任務處理能力
基於Anthropic研究的MCP服務器,為Claude AI提供'think'工具能力,增強複雜推理任務處理。
MCP代理工具適配器項目通過MCP協議實現模塊化工具調用,支持Google ADK和LangGraph兩種代理框架,提供動態推理和工具規劃能力。
一個為Cursor AI中的Claude提供高級推理能力的MCP服務器,包含多種推理方法如蒙特卡洛樹搜索、束搜索和Transformer混合推理等。
MCP Thought Server是一個為AI代理提供高級思維工具的服務,通過模型上下文協議(MCP)增強推理、規劃和迭代優化能力。它包含結構化思維、迭代草稿和集成思維等工具,支持SQLite持久化和高級置信度評分系統,可配置環境變量以適應不同需求。
一個為Cursor AI中的Claude提供高級推理能力的MCP服務器,包含多種推理方法和自動迭代功能。
Perplexity MCP服務器是一個Go編寫的中間件,為AI助手提供即時搜索和複雜推理能力
一個連接本地LLM與MCP服務器的TypeScript橋樑項目,提供Web界面使開源模型能使用類似Claude的工具能力,支持文件系統、網絡搜索和複雜推理等功能。
該項目通過集成DeepSeek R1的推理引擎增強Claude的複雜任務處理能力,提供多步驟精確推理支持。
Thoughtful Claude是一個增強Claude推理能力的MCP服務器,通過集成DeepSeek R1的高級推理引擎,為Claude提供複雜多步推理任務處理能力。
MCP推理服務器為Claude Desktop提供系統化推理能力,支持束搜索和蒙特卡洛樹搜索兩種策略,適用於數學、邏輯等複雜問題求解。
一個基於量子場計算模型的Claude多實例協同推理服務器,通過場一致性優化實現增強型AI推理能力。
Perplexity MCP Server是一個用Go編寫的中間件服務器,為AI助手(如Claude和Cursor)提供無縫訪問Perplexity API的能力,包括即時搜索和複雜推理功能。
一個增強AI模型推理能力的MCP服務器,通過結構化檢索和動態思維鏈提升問題解決能力。
結合DeepSeek推理與Claude生成能力的MCP服務
MCP邏輯求解器是一個結合大型語言模型與形式化定理證明能力的強大推理系統,支持自然語言和一階邏輯輸入,通過Prover9/Mace4進行自動驗證,並提供結構化推理和解釋。
官方實現的Anthropic'思考'工具MCP服務器,通過結構化思考顯著提升Claude的推理能力
MCP Chain of Draft Prompt Tool是一個增強LLM推理能力的工具,通過將標準提示轉換為Chain of Draft或Chain of Thought格式,顯著提高推理質量並減少token使用。