可灵AI公司宣布,其O1视频大模型已全量开放。该模型采用多模态视觉语言统一架构,支持文字、图像、视频融合输入,并引入思维链推理,号称全球首个统一多模态视频大模型。它可一次性完成文生视频、图生视频、局部编辑及镜头延展等任务,无需分步操作。
上海交大与上海AI实验室推出MM-HELIX项目,旨在解决多模态大模型在复杂推理中缺乏反思能力的问题。该项目通过模拟人类长链反思性推理,提升AI处理需多次尝试挑战的能力,推动模型从“耿直”转向灵活思考。
字节跳动火山引擎发布豆包大模型1.6版,国内首创支持分档调节思考长度功能。提供四档思考深度选项,用户可根据任务复杂度灵活平衡输出质量与响应速度。核心技术创新在于可调思考长度,低档位下token消耗量减少77.5%。
火山引擎在武汉AI巡展推出四款豆包大模型:升级版1.6支持四种思考长度,轻量版1.6lite,以及全新语音合成2.0与声音复刻2.0。升级显著提升智能化水平,为企业提供更灵活选择。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
$2
$20
Baidu
128
$8
$240
52
Bytedance
$1.2
$3.6
4
QuantTrio
Seed-OSS-36B-Instruct-AWQ 是字节跳动 Seed 团队开发的 36B 参数大语言模型的量化版本,具备强大的长上下文处理能力、推理能力和智能体功能,支持高达 512K 的上下文长度和灵活的思考预算控制。