腾讯发布混元Large-Vision多模态模型,采用MoE架构,激活参数达52B,平衡性能与效率。支持任意分辨率图像、视频及3D输入,提供全方位视觉理解能力,实现技术突破。
Tencent
$1
Input tokens/M
$4
Output tokens/M
32
Context Length
-
24
$0.8
$2
$0.5
224
$3
$9
16
4
Alibaba
$6
$6.4
$8
28
$2.4
$9.6
$1.5
$1.6
128
30
250
$12
$18
6