百度ワールドで発表された文心大モデル5.0は、テキスト・画像・音声を深層融合する「原生全モーダルモデル」として、従来のマルチモーダル手法を超え、中国AIの新時代を開く。....
PiはAI原生技術アーキテクチャのスマートなプレゼンテーションドキュメント生成ツールで、迅速に専門的で美しいプレゼンテーションを生成できます。
Google
$0.7
入力トークン/百万
$2.8
出力トークン/百万
1k
コンテキスト長
Anthropic
$7
$35
200
$2.1
$17.5
$21
$105
Alibaba
$3.9
$15.2
64
-
Bytedance
$0.8
$2
128
Deepseek
$4
$12
Tencent
$1
32
Openai
$1.75
$14
400
$525
Chatglm
Iflytek
$0.3
LiquidAI
LFM2-VL-3BはLiquid AIが開発したマルチモーダル視覚言語モデルで、LFM2バックボーンアーキテクチャに基づいて構築されており、強力な視覚理解と推論能力を備えており、特に細粒度な感知タスクで優れた性能を発揮します。このモデルは、テキストと画像の入力を効率的に処理することができ、最大512×512解像度の原生画像処理をサポートしています。