以色列科技公司Lightricks推出LTX-2视听合成系统,能根据文本描述直接生成20秒高清视频,实现音画同步。该系统突破传统“先画面后配音”流程,采用双流并行计算架构,通过190亿参数提升计算效能,更真实还原自然音画环境。
苹果发布SlowFast-LLaVA模型,在长视频分析任务中表现优异,超越更大参数模型。其双流架构通过慢流捕捉静态细节,快流处理动态信息,有效解决传统逐帧处理的信息冗余和上下文窗口溢出问题,为长视频内容分析提供高效解决方案。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Alibaba
$4
$16
1k
$2
$20
-
Bytedance
$1.2
$3.6
4
256
Moonshot
$0.8
128
$10.5
Tencent
$1
32
Deepseek
$12
Openai
$0.4
$0.75
$8.75
$70
400
64
$0.63
$3.15
131
24
Chatglm
$8