DeepSeek發佈V3.2標準版與深度思考版。評測顯示,V3.2在128k上下文場景下與GPT-5互有勝負;深度思考版在多項基準測試中與Gemini3Pro持平,並在IMO2025盲測中達到金牌分數線。核心升級是轉正稀疏注意力技術,通過優化token路由,顯著降低了長文本的計算複雜度、顯存佔用,並提升了推理速度,首次在開源模型中實現了百萬token的單卡推理能力。
DeepSeek發佈實驗模型V3.2-exp,採用創新稀疏注意力機制,顯著降低長上下文操作的推理成本,使API成本減少一半。該模型爲開發者提供更經濟高效的AI解決方案。
DeepSeek發佈實驗模型V3.2-exp,採用創新的“稀疏注意力”機制顯著降低長上下文推理成本。該模型已在Hugging Face和GitHub同步上線,核心是通過“閃電索引器”和注意力機制優化處理效率。這一突破性技術有望推動AI在長文本處理領域的發展。
DeepSeek悄然上線新版模型,疑似V3.2版本。雖然官方未明確型號,但Hugging Face平臺出現對應命名空間,隨後又顯示404下架。V3系列此前已憑卓越性能和開源策略震動AI界,此次短暫亮相又神祕消失,更添懸念。
Fentible
Cthulhu是一個基於Mistral Small v3.2和v3.1的大型模型融合項目,通過融合多個尖端微調模型創建的超強24B參數語言模型。它具有章魚般的多面性特徵,提供無審查的創造性文本生成能力,擅長散文創作、指令遵循和深奧知識表達。
DavidAU
基於Stheno v3.2模型的NEO CLASS量化版本,採用先進的量化技術提升模型性能,在保持高質量輸出的同時顯著降低計算資源需求。