硅基流动发布实验性模型DeepSeek-V3.2-Exp,支持160K上下文长度,价格直降超50%。该模型基于V3.1-Terminus深度优化,引入DeepSeek稀疏注意力机制,显著提升长文本训练和推理效率。
京东物流在JDDiscovery-2025大会上发布“超脑大模型2.0”和“异狼具身智能机械臂系统”,推动物流行业智能化升级。AI日报栏目聚焦AI热点,为开发者提供技术趋势和创新应用资讯,助力把握AI发展动态。
DeepSeek发布V3.1-Terminus版本,暗示V3系列或将收官。本次更新重点提升模型稳定性,修复了此前“极你太美”异常输出问题,通过优化语言处理机制解决不当回复缺陷。版本命名预示产品线重要转折,技术团队集中改进系统可靠性。
近日,DeepSeek V3.1模型被曝出“极字Bug”,API输出中随机夹杂“极”字,引发开发者广泛讨论。问题最初在火山引擎、chutes等平台被发现,随后蔓延至腾讯CodeBuddy及DeepSeek官方服务,国内社区对此高度关注。
Deepseek
$4
输入tokens/百万
$12
输出tokens/百万
128
上下文长度
Baidu
-
32
Tencent
28
$1
8
01-ai
4
Bytedance
$5
$9
256
prithivMLmods
Mintaka-Qwen3-1.6B-V3.1是一个高效的、专注于科学推理的模型,基于Qwen-1.6B构建,并在DeepSeek v3.1合成轨迹(10,000条记录)上进行训练。它针对随机事件模拟、逻辑问题分析和结构化科学推理进行了优化,在符号精度和轻量级部署之间取得了平衡。
Fentible
Cthulhu是一个基于Mistral Small v3.2和v3.1的大型模型融合项目,通过融合多个尖端微调模型创建的超强24B参数语言模型。它具有章鱼般的多面性特征,提供无审查的创造性文本生成能力,擅长散文创作、指令遵循和深奥知识表达。
Linaqruf
Anything V3.1 是潜在扩散模型 Anything V3.0 的第三方延续版本,专注于生成和修改动漫主题图像。
该项目创建了一个OpenAPI MCP代理服务器,可将任何符合OpenAPI v3.1规范的API转换为Claude工具,支持通过自然语言交互调用API端点,包括文件上传功能。