Salesforce、xGen-MMというオープンソースのマルチモーダルAIモデルを発表、ビジュアル理解を支援
Salesforceは、テキストや画像など複数のデータタイプを同時に理解および生成することを目的とした、xGen-MMというオープンソースのマルチモーダルAIモデルを発表しました。これは、AI研究とアプリケーションの方法を大幅に変える可能性があります。このモデルは複数のベンチマークテストで優れたパフォーマンスを示しており、同様のオープンソースモデルと比較しても遜色ありません。事前学習済みモデル、データセット、ファインチューニングコードが含まれています。最大40億のパラメータを持つ最大モデルは、「インターリーブデータ」を処理し、複数の画像に関する質問への回答など、マルチタスクを実行できます。モデルの多様な選択肢は、AIの能力に対する期待を反映しています。