硅基流動發佈實驗性模型DeepSeek-V3.2-Exp,支持160K上下文長度,價格直降超50%。該模型基於V3.1-Terminus深度優化,引入DeepSeek稀疏注意力機制,顯著提升長文本訓練和推理效率。
京東物流在JDDiscovery-2025大會上發佈“超腦大模型2.0”和“異狼具身智能機械臂系統”,推動物流行業智能化升級。AI日報欄目聚焦AI熱點,爲開發者提供技術趨勢和創新應用資訊,助力把握AI發展動態。
DeepSeek發佈V3.1-Terminus版本,暗示V3系列或將收官。本次更新重點提升模型穩定性,修復了此前“極你太美”異常輸出問題,通過優化語言處理機制解決不當回覆缺陷。版本命名預示產品線重要轉折,技術團隊集中改進系統可靠性。
近日,DeepSeek V3.1模型被曝出“極字Bug”,API輸出中隨機夾雜“極”字,引發開發者廣泛討論。問題最初在火山引擎、chutes等平臺被發現,隨後蔓延至騰訊CodeBuddy及DeepSeek官方服務,國內社區對此高度關注。
Deepseek
$4
輸入tokens/百萬
$12
輸出tokens/百萬
128
上下文長度
Baidu
-
32
Tencent
28
$1
8
01-ai
4
Bytedance
$5
$9
256
prithivMLmods
Mintaka-Qwen3-1.6B-V3.1是一個高效的、專注於科學推理的模型,基於Qwen-1.6B構建,並在DeepSeek v3.1合成軌跡(10,000條記錄)上進行訓練。它針對隨機事件模擬、邏輯問題分析和結構化科學推理進行了優化,在符號精度和輕量級部署之間取得了平衡。
Fentible
Cthulhu是一個基於Mistral Small v3.2和v3.1的大型模型融合項目,通過融合多個尖端微調模型創建的超強24B參數語言模型。它具有章魚般的多面性特徵,提供無審查的創造性文本生成能力,擅長散文創作、指令遵循和深奧知識表達。
Linaqruf
Anything V3.1 是潛在擴散模型 Anything V3.0 的第三方延續版本,專注於生成和修改動漫主題圖像。
該項目創建了一個OpenAPI MCP代理服務器,可將任何符合OpenAPI v3.1規範的API轉換為Claude工具,支持通過自然語言交互調用API端點,包括文件上傳功能。