谷歌在Gemini應用中新增“立即回答”功能,旨在減少用戶等待焦慮。用戶可一鍵跳過深度思考環節,快速獲取答案。該功能適用於Pro版和思考版模型,按鈕旁會顯示加載狀態。
元寶平臺2025年報告顯示,混元大模型實現AI能力多維度升級。平臺提供“快思考”與“深度思考”兩種模式:超七成用戶選擇“快思考”,近半數問題首輪即可解決;“深度思考”適用於複雜場景,對話通常持續三輪以上,近半數能輸出多步驟結構化內容。圖像交互方面,混元T1-Vis模型於5月上線。
DeepSeek發佈V3.2標準版與深度思考版。評測顯示,V3.2在128k上下文場景下與GPT-5互有勝負;深度思考版在多項基準測試中與Gemini3Pro持平,並在IMO2025盲測中達到金牌分數線。核心升級是轉正稀疏注意力技術,通過優化token路由,顯著降低了長文本的計算複雜度、顯存佔用,並提升了推理速度,首次在開源模型中實現了百萬token的單卡推理能力。
上汽榮威在廣州車展發佈M7DMH中大型轎車,搭載與字節跳動豆包合作的“深度思考大模型”,實現智能車機交互。車輛能理解複雜指令(如調節空調和座椅加熱)、自動播放安撫音樂、記憶日程並規劃路線,從機械工具轉變爲貼心出行夥伴。
展示小型語言模型通過自我演化深度思考掌握數學推理能力的研究成果。
深度推理翻譯模型,通過長思考鏈優化神經機器翻譯。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
DavidAU
這是一個基於Qwen3-Coder-30B-A3B-Instruct的混合專家模型,擁有540億參數和100萬上下文長度。模型通過三步合併和Brainstorm 40X優化,具備強大的編程能力和通用場景處理能力,特別集成了思考模塊,能夠在回答前進行深度推理。
Mungert
基於RWKV-7架構的輕量級語言模型,採用flash-linear attention格式,具備多語言支持和深度思考能力,適用於文本生成任務。
Qwen 4B模型的三種量化版本(Q8_0),分別支持64K、128K和256K的上下文長度,專為長文本生成和深度思考任務優化
soob3123
深度思考模型是一款專為分析性任務設計的文本生成模型,能夠在處理敏感查詢時保持分析中立,確保在有爭議的話題上維持事實完整性。
Vijayendra
DeepThinkerv2是一個具備深度數學推理能力的大語言模型,通過遞歸思考模式和多重驗證機制提升解題準確性。
zai-org
GLM-4-Z1-32B-0414是GLM家族新一代開源大語言模型,擁有320億參數,具備深度思考能力。通過冷啟動和擴展強化學習訓練,在數學、代碼和邏輯任務上表現優異,支持便捷的本地部署。
fla-hub
基於Flash線性注意力機制的RWKV-7 g1模型,支持多語言處理並具備深度思考能力
DevQuasar
DeepHermes是一個基於Llama-3架構的8B參數語言模型預覽版,專注於深度思考和長鏈式推理能力。
這是一個實驗性構建的大型語言模型,結合了Dolphin3.0-R1-Mistral-24B與Brainstorm 40x技術,參數量達45B,具備強大的深度推理和思考能力。模型支持32k上下文長度,採用CHATML模板格式,特別優化了推理過程的詳細輸出。