硅基流動發佈實驗性模型DeepSeek-V3.2-Exp,支持160K上下文長度,價格直降超50%。該模型基於V3.1-Terminus深度優化,引入DeepSeek稀疏注意力機制,顯著提升長文本訓練和推理效率。
智譜AI發佈並開源新一代模型GLM-4.6,在Agentic Coding等關鍵能力上實現大幅提升。其編程能力已對齊國際頂尖模型Claude Sonnet4,並超越DeepSeek-V3.2-Exp,成爲當前國內最強代碼生成模型。該模型在國產化適配方面取得里程碑進展,已成功部署於寒武紀國產芯片平臺。
寒武紀成功適配DeepSeek-V3.2-Exp實驗模型並開源vLLM-MLU推理引擎,推動AI技術發展。該模型在功能效率上創新突破,標誌寒武紀大模型軟件生態建設取得重要進展,爲開發者提供新工具,增強行業信心。
QuantTrio
DeepSeek-V3.2-Exp-AWQ是基於DeepSeek-V3.2-Exp模型的量化版本,通過vLLM框架實現高效文本生成。該模型引入了DeepSeek稀疏注意力機制,在長上下文訓練和推理效率上有顯著提升,同時保持了模型輸出質量。
deepseek-ai
變換器庫是一個強大的自然語言處理工具庫,提供豐富的預訓練模型和便捷的使用接口,廣泛應用於文本生成、分類、翻譯等NLP任務,極大提升開發效率。