DeepSeek創始人梁文鋒近日宣佈,新一代旗艦模型DeepSeek V4將於2026年4月下旬發佈。在此之前,產品已引入分層模式:快速模式主打日常對話和即時響應,支持圖片和文件文字識別;專家模式則專注於複雜邏輯和深度思考,能力更強。
網易有道推出“有道寶庫”AI知識庫產品,主打文檔深度管理與智能再創作。該產品支持全格式文檔上傳,用戶可通過對話提問獲取信息,實現從被動存儲到主動生成的跨越,旨在打造“會思考”的數字資料庫。
亞馬遜AWS正開發AI智能體,旨在自動化執行部分部門職能,這些部門恰是此前裁員重災區。該技術或將替代數千名專家,深入網絡安全等核心領域,引發對人力資源與技術替代的深度思考。
OpenAI發佈GPT-5.4模型,實現推理、編程與智能體工作流統一。新增“思維”模式,AI在回答前展示思考計劃,用戶可實時介入調整。同時增強深度搜索能力。
首個為人腦思維打造的工具,處理知識,讓思考自由展開、關聯與演化。
滿血版DeepSeek,支持深度思考和聯網搜索,免費不限次數,助力多種任務完成。
展示小型語言模型通過自我演化深度思考掌握數學推理能力的研究成果。
深度推理翻譯模型,通過長思考鏈優化神經機器翻譯。
Openai
-
輸入tokens/百萬
輸出tokens/百萬
上下文長度
Anthropic
$105
$525
200
Alibaba
$1
$10
256
$2
$20
Bytedance
Moonshot
$4
$16
$0.8
$0.15
$1.5
$8
Deepseek
$12
128
Tencent
32
$0.4
$0.75
$8.75
$70
400
$0.63
$3.15
131
Chatglm
DavidAU
這是一個基於Qwen3-Coder-30B-A3B-Instruct的混合專家模型,擁有540億參數和100萬上下文長度。模型通過三步合併和Brainstorm 40X優化,具備強大的編程能力和通用場景處理能力,特別集成了思考模塊,能夠在回答前進行深度推理。
Mungert
基於RWKV-7架構的輕量級語言模型,採用flash-linear attention格式,具備多語言支持和深度思考能力,適用於文本生成任務。
Qwen 4B模型的三種量化版本(Q8_0),分別支持64K、128K和256K的上下文長度,專為長文本生成和深度思考任務優化
soob3123
深度思考模型是一款專為分析性任務設計的文本生成模型,能夠在處理敏感查詢時保持分析中立,確保在有爭議的話題上維持事實完整性。
Vijayendra
DeepThinkerv2是一個具備深度數學推理能力的大語言模型,通過遞歸思考模式和多重驗證機制提升解題準確性。
zai-org
GLM-4-Z1-32B-0414是GLM家族新一代開源大語言模型,擁有320億參數,具備深度思考能力。通過冷啟動和擴展強化學習訓練,在數學、代碼和邏輯任務上表現優異,支持便捷的本地部署。
THUDM
GLM-4-Z1-32B-0414是具備深度思考能力的320億參數推理模型,在數學、代碼和邏輯類任務上表現優異
LGAI推出的EXONE系列推理模型,採用新矩陣和極致量化技術,具備32k上下文窗口,專注於深度思考和推理任務。
fla-hub
基於Flash線性注意力機制的RWKV-7 g1模型,支持多語言處理並具備深度思考能力
DevQuasar
DeepHermes是一個基於Llama-3架構的8B參數語言模型預覽版,專注於深度思考和長鏈式推理能力。
這是一個實驗性構建的大型語言模型,結合了Dolphin3.0-R1-Mistral-24B與Brainstorm 40x技術,參數量達45B,具備強大的深度推理和思考能力。模型支持32k上下文長度,採用CHATML模板格式,特別優化了推理過程的詳細輸出。
基於Gemini API的深度思考與分析服務器,提供多角度問題分析、批判性與創造性思維整合、代碼質量評估及優化建議,支持技術決策與解決方案設計。
該項目實現了一個基於多智能體系統(MAS)的高級順序思考流程,通過Agno框架構建並由MCP提供服務。相比簡單的狀態跟蹤方法,它利用協調的專門代理進行深度分析和問題分解,從被動的思維記錄器進化為主動的思維處理器。