アップル、21種類の異なるモダリティを処理可能な万能ビジョンモデル「4M-21」を発表
アップルとスイス連邦工科大学ローザンヌ校(EPFL)の研究者らが共同で開発した、任意のモダリティ間の変換が可能な単一モデル。数十種類にも及ぶ多様なモダリティでトレーニングされ、大規模なマルチモーダルデータセットとテキストコーパスを協調して学習しています。4M-21と名付けられたこのモデルは、21種類の異なるモダリティでトレーニングされており、既存のモデルと比較して少なくとも3倍以上のタスクをこなすことができ、パフォーマンスの低下もありません。