説明はありません
Aya Vision 32Bは、OCR、画像記述、視覚推論など、多様な用途に適した多言語対応のビジュアル言語モデルです。
8億パラメーターの多言語視覚言語モデルで、OCR、画像キャプション、視覚推論などの機能をサポートしています。
Aya Visionは、Cohereが提供する多言語?多モーダルなビジュアルモデルであり、多言語環境における視覚とテキストの理解能力の向上を目指しています。
Bytedance
$0.8
入力トークン/百万
$8
出力トークン/百万
256
コンテキスト長
Tencent
-
24
$3
$9
128
16
32
$1.5
$4.5
$18
6
Moonshot
$2
$10
8
$5
$20
$30
131
CohereLabs
Aya Vision 32BはCohereラボが開発したオープンウェイト32Bパラメータのマルチモーダルモデルで、23言語の視覚言語タスクをサポートします。
Aya Vision 8Bはオープンウェイトの80億パラメータ多言語視覚言語モデルで、23言語の視覚と言語タスクをサポートします。