腾讯发布混元Large-Vision多模态模型,采用MoE架构,激活参数达52B,平衡性能与效率。支持任意分辨率图像、视频及3D输入,提供全方位视觉理解能力,实现技术突破。
Tencent
$1
输入tokens/百万
$4
输出tokens/百万
32
上下文长度
-
24
$0.8
$2
$0.5
224
$3
$9
16
4
Alibaba
$6
$6.4
$8
28
$2.4
$9.6
$1.5
$1.6
128
30
250
$12
$18
6