DeepSeek於2月11日灰度更新網頁端和APP端,14日正式官宣爲新長文本模型結構測試。此次更新支持最高100萬token超長上下文,知識庫更新至2025年5月。但API服務仍爲V3.2版本,僅支持128K上下文。業內視此次更新爲下一代V4模型發佈前的技術預熱和壓力測試,引發對V4的廣泛期待。更新後,DeepSeek的交互風格也發生明顯變化。
國產AI公司DeepSeek在GitHub代碼庫中更新FlashMLA代碼,被發現大量指向未知模型“MODEL1”的標識符。該標識符與現有V3.2版本並列提及,暗示這可能是一個全新的模型序列,而非簡單迭代。
騰訊自研大模型混元2.0(Tencent HY2.0)正式發佈,與此同時,DeepSeek V3.2也逐步接入騰訊生態。目前,這兩大模型已在元寶、ima等騰訊AI原生應用中率先上線,騰訊雲也同步開放了相關模型的API及平臺服務。 全新發布的Tencent HY2.0採用混合專家(MoE)架構,總參數量高達4
DeepSeek-V3.2正式版與極致推理版同步發佈,支持網頁端、App、API一鍵切換,性能再證“開源最強”。最大亮點是首次實現“思考過程”與“工具調用”深度融合,支持兩種模式並行:思考模式可進行長鏈條推理,工具調用模式則能高效執行任務。
Fentible
Cthulhu是一個基於Mistral Small v3.2和v3.1的大型模型融合項目,通過融合多個尖端微調模型創建的超強24B參數語言模型。它具有章魚般的多面性特徵,提供無審查的創造性文本生成能力,擅長散文創作、指令遵循和深奧知識表達。
DavidAU
基於Stheno v3.2模型的NEO CLASS量化版本,採用先進的量化技術提升模型性能,在保持高質量輸出的同時顯著降低計算資源需求。