DeepSeek發佈實驗模型V3.2-exp,採用創新稀疏注意力機制,顯著降低長上下文操作的推理成本,使API成本減少一半。該模型爲開發者提供更經濟高效的AI解決方案。
DeepSeek發佈實驗模型V3.2-exp,採用創新的“稀疏注意力”機制顯著降低長上下文推理成本。該模型已在Hugging Face和GitHub同步上線,核心是通過“閃電索引器”和注意力機制優化處理效率。這一突破性技術有望推動AI在長文本處理領域的發展。