OpenAI發佈GPT-5.4模型,實現推理、編程與智能體工作流統一。新增“思維”模式,AI在回答前展示思考計劃,用戶可實時介入調整。同時增強深度搜索能力。
OpenAI發佈GPT-5.4系列模型,包括標準版、專注複雜邏輯的推理版GPT-5.4Thinking及高性能優化版GPT-5.4Pro。其API版本支持100萬個標記的上下文窗口,爲OpenAI史上最大,顯著提升了處理能力和效率。
聯想在MWC 2026上推出ThinkBook模塊化AI PC概念機,通過MagicBay接口實現硬件自由組合,打破傳統筆記本形態限制,支持用戶按需擴展功能,體現了“隨需應變”的創新設計理念。
聯想在MWC上推出模塊化概念筆記本ThinkBook Modular AI PC Concept,打破傳統硬件固定形態,實現硬件“按需定製”。其最大亮點是鍵盤與機身可分離的模塊化設計,提供極致靈活性。
AI驅動的圖像矢量化與塗鴉創作,將提示轉化為可編輯SVG和視頻
Gemini 2.0 Flash Thinking Experimental 是一款增強推理模型,能夠展示其思考過程以提升性能和可解釋性。
谷歌開發的AI模型,提供推理能力更強的響應。
讓Claude在回應前進行深入思考
Alibaba
$2
輸入tokens/百萬
$20
輸出tokens/百萬
-
上下文長度
Bytedance
$0.8
$8
256
$4
$16
128
$3
$9
Google
Baidu
Moonshot
$200
131
John1604
Qwen3 VL 4B Thinking 是一個支持圖像到文本以及文本到文本轉換的多模態模型,具有4B參數規模,能夠滿足多種圖文交互需求。
Intel
DeepMath是一個40億參數的數學推理模型,基於Qwen3-4B Thinking構建,結合了微調的大語言模型與沙盒化Python執行器。它能夠為計算步驟生成簡潔的Python代碼片段,顯著減少錯誤並縮短輸出長度。
allenai
Olmo 3是由Allen Institute for AI (Ai2)開發的一系列語言模型,包含7B和32B兩種規格,有Instruct和Think兩種變體。該模型基於Transformer架構,具有長鏈思維能力,可有效提升數學和編碼等推理任務的表現。
Olmo 3是由Allen Institute for AI開發的開源語言模型系列,包含7B和32B兩種規格,分為指令(Instruct)和思考(Think)兩種變體。該模型具有出色的長鏈思維能力,能夠顯著提升數學和編碼等推理任務的表現。
Olmo 3是由Allen Institute for AI開發的全新語言模型家族,包含7B和32B兩種規模,有指令(Instruct)和思維(Think)兩種變體。該模型採用長鏈式思維提升數學和編碼等推理任務表現,旨在推動語言模型科學發展。
inferencerlabs
Kimi - K2 - Thinking 3.825bit MLX 是一款用於文本生成的量化模型,通過不同的量化方式在測試中取得不同的困惑度表現,其中q3.825bit量化能達到1.256的困惑度。
Olmo 3 32B Think SFT是基於Transformer架構的自迴歸語言模型,在長鏈思維推理方面表現出色,特別擅長處理數學和編碼等複雜推理任務。該模型在Dolma 3數據集上進行預訓練,並在Dolci數據集上進行監督微調。
Olmo 3是Allen Institute for AI (Ai2)開發的全新32B參數語言模型家族,包含Base、Instruct和Think等變體。該模型基於Dolma 3數據集訓練,支持65,536的長上下文處理,旨在推動語言模型科學發展。模型完全開源,遵循Apache 2.0許可證。
moonshotai
Kimi K2 Thinking 是月之暗面(Moonshot AI)開發的最新一代開源思維模型,具有強大的深度推理能力和工具調用功能。該模型採用混合專家架構,支持原生INT4量化,擁有256k上下文窗口,在多個基準測試中表現出色。
GeneralAnalysis
GA Guard Thinking是General Analysis開發的40億參數開源審核模型,專門用於檢測和防止語言模型生成不安全、不合規的內容。該模型在七個安全類別上進行訓練,能夠有效識別非法活動、仇恨言論、個人信息洩露等風險內容。
Olmo 3是由Allen Institute for AI開發的全新7B參數語言模型系列,基於Transformer架構,在Dolma 3數據集上訓練,旨在推動語言模型科學發展。模型提供Base、Instruct和Think等多種變體,支持最長65,536的上下文長度。
QuantFactory
這是基於llama.cpp對Qwen3-4B-v0.4-deepresearch-no-think-4進行量化處理後的版本,專門針對深度研究場景優化,移除了think機制,採用GGUF格式提供更高效的推理性能。
lmstudio-community
這是Qwen3 235B A22B Thinking 2507模型的量化版本,通過llama.cpp的量化技術實現,可在資源有限環境下高效運行文本生成任務,是LM Studio社區模型亮點計劃的一部分。
launch
ThinkPRM-7B是一款基於R1-Distill-Qwen-7B架構的生成式過程獎勵模型,專門用於對推理過程進行逐步驗證。它通過生成明確的驗證思維鏈來評估數學解題、代碼生成等推理任務的每一步正確性,具有數據效率高、可解釋性強的特點。
AM Thinking v1是由A-M團隊開發的基於Qwen 2.5-32B-Base的大語言模型,增強推理能力,支持132k tokens的上下文長度。
Vinnnf
Thinkless是一個通過強化學習訓練的大語言模型,能夠自適應選擇簡答或長鏈推理模式,顯著降低推理計算成本。
無思框架(Thinkless)是一種可學習框架,使大模型能根據任務複雜度和自身能力,自適應選擇簡短推理或長鏈推理。
KissanAI
針對印度農業的氣候智能型農業(CRSA)推理增強模型的實驗性研究預覽版
simone-papicchio
基於Qwen2.5-Coder-7B-Instruct微調的文本轉SQL推理模型,增強LLM在文本轉SQL任務中的推理能力
ThinkPRM-1.5B是基於R1-Distill-Qwen-1.5B架構的生成式過程獎勵模型,能夠通過生成驗證思維鏈對推理過程進行逐步驗證。
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
結合DeepSeek推理與Claude生成的兩階段AI對話服務
基於Anthropic研究的MCP服務器,為Claude AI提供'think'工具能力,增強複雜推理任務處理。
Sequential Thinking MCP是一個支持AI代理進行高級元認知和動態反思問題解決的MCP服務器,通過虛擬記錄思維和計劃來指導複雜任務的分步執行。
基於分支思維的MCP服務器工具,支持多線程思考導航和智能洞察生成
Sequential Thinking MCP是一個提供結構化思維過程的MCP服務器,通過分步解決問題、管理假設並與Recall區塊鏈集成來存儲思維日誌,支持動態調整和反思性思考。
Think MCP是一個實現MCP服務器的項目,提供'think'工具以支持AI代理在複雜任務中進行結構化推理,靈感來自Anthropic的研究。該工具通過記錄思考過程幫助AI處理信息、回溯或遵守策略,適用於工具輸出分析、策略密集環境和順序決策場景。
為Claude AI提供結構化思考工具的服務
一個為Claude設計的結構化思考工具MCP服務器,用於提升複雜問題解決能力
ThinkingCap是一個基於模型上下文協議的多智能體研究服務器,可並行運行多個LLM提供商並綜合其響應,實現全面的多角度分析。
Smart-Thinking是一個先進的MCP服務器,提供多維、自適應且可自驗證的AI推理框架,採用基於圖形的架構實現複雜思維連接,支持跨平臺運行並與多種MCP客戶端兼容。
一個基於TypeScript的非常規思維服務器,通過生成挑戰傳統思維的非常規想法,幫助解決複雜問題。
MCP Server MAS Sequential Thinking 是一個專注於增強順序思維過程的服務器環境項目,提供模塊化設計、可擴展性和多語言支持,適用於教育、研究和應用開發。
一個基於TypeScript的MCP服務器,幫助LLM構建思維導圖進行結構化思考,包含質量評分、階段管理、分支探索和記憶管理功能。
Think Server的MCP服務器配置指南
Deepseek Thinker MCP Server是一個提供Deepseek推理內容的MCP服務,支持OpenAI API和本地Ollama兩種模式,可集成到AI客戶端中。
官方實現的Anthropic'思考'工具MCP服務器,通過結構化思考顯著提升Claude的推理能力
基於Gemini API的思維分析服務器,提供複雜問題分解與思考能力
一個簡化版的MCP服務器,專門為AI代理提供'think'工具,用於在複雜任務中記錄結構化思考過程,不涉及外部狀態變更或信息獲取。
MAXential Thinking MCP 是一個為AI模型提供結構化推理工具的服務,支持思維鏈的分支、修訂、合併和導航,實現透明、可追溯的思考過程。