DeepSeek發佈V3.2標準版與深度思考版。評測顯示,V3.2在128k上下文場景下與GPT-5互有勝負;深度思考版在多項基準測試中與Gemini3Pro持平,並在IMO2025盲測中達到金牌分數線。核心升級是轉正稀疏注意力技術,通過優化token路由,顯著降低了長文本的計算複雜度、顯存佔用,並提升了推理速度,首次在開源模型中實現了百萬token的單卡推理能力。
上汽榮威在廣州車展發佈M7DMH中大型轎車,搭載與字節跳動豆包合作的“深度思考大模型”,實現智能車機交互。車輛能理解複雜指令(如調節空調和座椅加熱)、自動播放安撫音樂、記憶日程並規劃路線,從機械工具轉變爲貼心出行夥伴。
OpenAI發佈GPT-5.1,標誌AI競賽進入"情商融合"新階段。模型重點強化情緒價值、個性化交互與人性化表達,解決用戶反饋的"AI冰冷"問題。採用雙模型架構:Instant模式快速響應,Thinking模式深度思考。全球分批推送中,付費用戶3個月內可繼續使用GPT-5過渡。
月之暗面發佈並開源Kimi K2Thinking模型,顯著提升智能代理和推理能力。該模型能自主邊思考邊使用工具,無需用戶干預,支持長達300輪工具調用和多輪深度思考,旨在高效處理複雜任務。
展示小型語言模型通過自我演化深度思考掌握數學推理能力的研究成果。
深度推理翻譯模型,通過長思考鏈優化神經機器翻譯。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
DavidAU
這是一個基於Qwen3-Coder-30B-A3B-Instruct的混合專家模型,擁有540億參數和100萬上下文長度。模型通過三步合併和Brainstorm 40X優化,具備強大的編程能力和通用場景處理能力,特別集成了思考模塊,能夠在回答前進行深度推理。
Mungert
基於RWKV-7架構的輕量級語言模型,採用flash-linear attention格式,具備多語言支持和深度思考能力,適用於文本生成任務。
Qwen 4B模型的三種量化版本(Q8_0),分別支持64K、128K和256K的上下文長度,專為長文本生成和深度思考任務優化
soob3123
深度思考模型是一款專為分析性任務設計的文本生成模型,能夠在處理敏感查詢時保持分析中立,確保在有爭議的話題上維持事實完整性。
Vijayendra
DeepThinkerv2是一個具備深度數學推理能力的大語言模型,通過遞歸思考模式和多重驗證機制提升解題準確性。
zai-org
GLM-4-Z1-32B-0414是GLM家族新一代開源大語言模型,擁有320億參數,具備深度思考能力。通過冷啟動和擴展強化學習訓練,在數學、代碼和邏輯任務上表現優異,支持便捷的本地部署。
fla-hub
基於Flash線性注意力機制的RWKV-7 g1模型,支持多語言處理並具備深度思考能力
DevQuasar
DeepHermes是一個基於Llama-3架構的8B參數語言模型預覽版,專注於深度思考和長鏈式推理能力。
這是一個實驗性構建的大型語言模型,結合了Dolphin3.0-R1-Mistral-24B與Brainstorm 40x技術,參數量達45B,具備強大的深度推理和思考能力。模型支持32k上下文長度,採用CHATML模板格式,特別優化了推理過程的詳細輸出。