TencentがMoEアーキテクチャ採用の多モーダルモデル「混元Large-Vision」を発表。52Bの活性化パラメータで性能と効率を両立し、任意解像度の画像/動画/3D入力に対応。包括的な視覚理解を実現する技術的ブレークスルー。....
Tencent
$1
入力トークン/百万
$4
出力トークン/百万
32
コンテキスト長
-
$0.8
$2
$0.5
224
$3
$9
16
4
Alibaba
$6
$6.4
$8
28
$2.4
$9.6
$1.5
$1.6
128
250
$3.5
$7
$15
$45