苹果发布SlowFast-LLaVA模型,在长视频分析任务中表现优异,超越更大参数模型。其双流架构通过慢流捕捉静态细节,快流处理动态信息,有效解决传统逐帧处理的信息冗余和上下文窗口溢出问题,为长视频内容分析提供高效解决方案。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Alibaba
$4
$16
1k
$2
$20
-
Bytedance
$1.2
$3.6
4
256
Moonshot
$0.8
128
$10.5
Tencent
$1
32
Deepseek
$12
Openai
$0.4
$0.75
$8.75
$70
400
64
$0.63
$3.15
131
24
Chatglm
$8