字節跳動正加速自研AI芯片“SeedChip”,計劃今年量產至少10萬顆,主要面向推理任務,以保障AI算力供應。儘管公司稱相關報道“不準確”,但其今年AI採購預算已超1600億元,半數仍用於購買英偉達芯片,反映出在推進大模型時面臨的高推理成本壓力。
Positron發佈AI推理芯片Asimov,宣稱其能效比和性價比預計達英偉達下一代產品的5倍,引發行業關注。該芯片針對大模型推理優化,通過簡化GPU架構提升效率。
上海AI實驗室發佈全球最大開源科學多模態模型“書生 Intern-S1-Pro”,參數達1萬億。該模型基於“通專融合”架構SAGE,在科學能力上達到國際領先水平,尤其在複雜學科評測中展現出卓越的邏輯推理能力。
谷歌DeepMind聯合Kaggle升級Game Arena平臺,新增“狼人殺”和“撲克”兩款遊戲,推動AI測試從邏輯運算轉向社交推理與不確定決策,以更全面評估模型性能。
Black Forest Labs推出,亞秒級推理、統一編輯、照片級畫質AI圖像生成器。
Nano Banana Pro是前沿AI圖像生成引擎,4K畫質、角色一致,推理生成強大。
Google DeepMind旗艦多模態AI,1M上下文,具備博士級推理與高級編碼能力
Google基於Gemini 3 Pro的AI圖像編輯器,推理強,生成編輯能力出色
Xai
$1.4
輸入tokens/百萬
$3.5
輸出tokens/百萬
2k
上下文長度
Openai
$7.7
$30.8
200
-
Anthropic
$105
$525
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
Moonshot
$0.8
allenai
Olmo 3是由Allen Institute for AI開發的新一代語言模型家族,包含7B和32B的指令和思維變體。該模型在長鏈式思維方面表現出色,能顯著提升數學和編碼等推理任務的性能。所有代碼、檢查點和訓練細節都將公開,推動語言模型科學發展。
Olmo 3是由Allen Institute for AI開發的新一代語言模型系列,包含7B和32B兩種規模,有指令和思考兩種變體。該模型基於Dolma 3數據集進行預訓練,在Dolci數據集上進行後訓練,具備長鏈式思維能力,在數學和編碼等推理任務上表現優異。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款強大的跨具身視覺語言模型,在自動駕駛和具身AI任務中均展現出了卓越的性能。它是首個將這兩個關鍵領域相結合的開源視覺語言模型,顯著提升了在動態物理環境中的理解和推理能力。
Olmo 3是由Allen Institute for AI開發的一系列語言模型,包含7B和32B兩種規模,具有指令式和思考式兩種變體。該模型在長鏈式思維方面表現出色,能有效提升數學和編碼等推理任務的性能。採用多階段訓練方式,包括有監督微調、直接偏好優化和可驗證獎勵的強化學習。
Olmo-3-7B-Think-DPO是Allen Institute for AI開發的7B參數語言模型,具有長鏈式思考能力,在數學和編碼等推理任務中表現出色。該模型經過監督微調、直接偏好優化和基於可驗證獎勵的強化學習等多階段訓練,專為研究和教育用途設計。
Olmo 3是由Allen Institute for AI (Ai2)開發的一系列語言模型,包含7B和32B兩種規格,有Instruct和Think兩種變體。該模型基於Transformer架構,具有長鏈思維能力,可有效提升數學和編碼等推理任務的表現。
Olmo 3是由Allen Institute for AI開發的開源語言模型系列,包含7B和32B兩種規格,分為指令(Instruct)和思考(Think)兩種變體。該模型具有出色的長鏈思維能力,能夠顯著提升數學和編碼等推理任務的表現。
Olmo 3是由Allen Institute for AI開發的全新語言模型家族,包含7B和32B兩種規模,有指令(Instruct)和思維(Think)兩種變體。該模型採用長鏈式思維提升數學和編碼等推理任務表現,旨在推動語言模型科學發展。
Olmo 3 7B RL-Zero Math是Allen AI開發的專為數學推理任務優化的70億參數語言模型,採用RL-Zero強化學習方法在數學數據集上進行訓練,能有效提升數學推理能力。
Olmo 3 7B RL-Zero Mix是Allen AI開發的7B參數規模的語言模型,屬於Olmo 3系列。該模型在Dolma 3數據集上進行預訓練,在Dolci數據集上進行後訓練,並通過強化學習優化數學、編碼和推理能力。
Olmo-3-32B-Think-DPO是Allen AI開發的32B參數語言模型,採用直接偏好優化(DPO)訓練,具備長鏈式思維推理能力,在數學、編碼等複雜推理任務上表現優異。
moonshotai
Kimi K2 Thinking 是月之暗面(Moonshot AI)開發的最新一代開源思維模型,具有強大的深度推理能力和工具調用功能。該模型採用混合專家架構,支持原生INT4量化,擁有256k上下文窗口,在多個基準測試中表現出色。
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持以及強大的空間和視頻動態理解能力。該模型採用2B參數規模,支持指令交互,適用於多模態AI應用。
TheStageAI
TheWhisper-Large-V3-Turbo 是 OpenAI Whisper Large V3 模型的高性能微調版本,由 TheStage AI 針對多平臺即時、低延遲和低功耗語音轉文本推理進行優化。支持流式轉錄、單詞時間戳和可擴展性能,適用於即時字幕、會議和設備端語音界面等場景。
TheWhisper-Large-V3是OpenAI Whisper Large V3模型的高性能微調版本,由TheStage AI針對多平臺(NVIDIA GPU和Apple Silicon)的即時、低延遲和低功耗語音轉文本推理進行了優化。
Mungert
PokeeResearch-7B是由Pokee AI開發的70億參數深度研究代理模型,結合了AI反饋強化學習(RLAIF)和強大的推理框架,能夠在工具增強的大語言模型中實現可靠、對齊和可擴展的研究級推理,適用於複雜的多步驟研究工作流程。
LiquidAI
LFM2-VL-3B是Liquid AI開發的多模態視覺語言模型,基於LFM2骨幹架構構建,具備強大的視覺理解和推理能力,特別在細粒度感知任務上表現出色。該模型能夠高效處理文本和圖像輸入,支持高達512×512分辨率的原生圖像處理。
PokeeAI
PokeeResearch-7B是由Pokee AI開發的70億參數深度研究智能體,結合基於AI反饋的強化學習(RLAIF)與推理框架,能夠執行復雜的多步驟研究工作流程,包括自我修正、驗證和綜合分析。
Olmo-3-7B-Think-SFT是Allen Institute for AI開發的7B參數語言模型,具有長鏈式思考能力,在數學和編碼等推理任務中表現優異。該模型基於Dolma 3數據集預訓練,並在Dolci數據集上進行了後續訓練。
bullpoint
GLM-4.6-AWQ是對智譜AI的GLM-4.6(357B MoE)進行高性能AWQ量化的模型,專為vLLM推理進行了優化,能有效提升生產部署的吞吐量。該模型採用4位量化技術,在保持高精度的同時顯著減少顯存佔用。
Perplexity MCP Server是一個智能研究助手,利用Perplexity的AI模型自動分析查詢複雜度並選擇最佳模型處理請求,支持搜索、推理和深度研究三種工具。
Perplexity MCP Server是一個智能研究助手,利用Perplexity的AI模型提供自動查詢複雜度檢測和最優模型路由功能,支持搜索、推理和深度研究三種工具。
結合DeepSeek推理與Claude生成的兩階段AI對話服務
基於Anthropic研究的MCP服務器,為Claude AI提供'think'工具能力,增強複雜推理任務處理。
MCP雙循環推理器是一個為自主AI代理設計的元認知增強工具,通過雙循環框架(哨兵監控和裁決器管理)實現異常檢測和經驗學習,提升代理的自我意識和可靠性。
MCP Thought Server是一個為AI代理提供高級思維工具的服務,通過模型上下文協議(MCP)增強推理、規劃和迭代優化能力。它包含結構化思維、迭代草稿和集成思維等工具,支持SQLite持久化和高級置信度評分系統,可配置環境變量以適應不同需求。
一個為Cursor AI中的Claude提供高級推理能力的MCP服務器,包含多種推理方法如蒙特卡洛樹搜索、束搜索和Transformer混合推理等。
一個基於Replicate API的FastMCP服務器實現,專注於提供資源化的AI模型推理訪問,特別擅長圖像生成功能。
Thoughtbox是一個AI思維輔助工具,通過分步思考、修訂和分支推理等功能,幫助用戶分解複雜問題並優化解決方案
一個為Cursor AI中的Claude提供高級推理能力的MCP服務器,包含多種推理方法和自動迭代功能。
Perplexity MCP服務器是一個Go編寫的中間件,為AI助手提供即時搜索和複雜推理能力
Think MCP是一個實現MCP服務器的項目,提供'think'工具以支持AI代理在複雜任務中進行結構化推理,靈感來自Anthropic的研究。該工具通過記錄思考過程幫助AI處理信息、回溯或遵守策略,適用於工具輸出分析、策略密集環境和順序決策場景。
MindBridge是一個AI模型路由服務器,支持多LLM提供商,實現智能模型調度與協作,適用於複雜推理任務和多模型工作流。
Smart-Thinking是一個先進的MCP服務器,提供多維、自適應且可自驗證的AI推理框架,採用基於圖形的架構實現複雜思維連接,支持跨平臺運行並與多種MCP客戶端兼容。
Smart-Thinking是一個先進的MCP服務器,提供多維、自適應且可自我驗證的AI推理框架。
Adaptive Graph of Thoughts是一個基於Neo4j圖數據庫的智能科學推理框架,通過圖結構實現複雜的科學推理任務,支持與Claude Desktop等AI應用集成。
基於MCP協議的深度推理服務器,為客戶端提供AI深度推理服務
一個基於TypeScript的MCP服務器,提供與Perplexity AI API交互的工具,支持搜索增強查詢和內部推理過程展示。
Archon是一個自主構建和優化AI代理的智能系統,通過迭代開發展示現代AI的關鍵原則,包括代理推理、領域知識整合和可擴展架構。當前版本V4提供了全面的Streamlit界面,支持Docker部署,並與MCP服務集成以實現AI IDE的無縫對接。
GemForge是將Google的Gemini AI與MCP生態系統連接的企業級工具,提供即時網絡訪問、高級推理、代碼分析和多文件處理等功能,支持60多種文件格式,具備智能模型選擇和強大的錯誤處理機制。