人工知能(AI)分野は、事前学習済みモデルと調整可能な表現形式へと進化を遂げており、マイクロソフトのFlorence-2はコンピュータビジョンにおける様々な課題に成功裏に対処しました。
多様なタスクを同時学習するマルチタスク学習と大規模データセットを活用することで、ゼロショット学習において優れた成果を上げています。シーケンスツーシーケンス構造を採用し、様々なタスクに対応できる統一的な基盤モデルとして、柔軟性の高いビジョン基盤モデルとなっています。
研究チームは、広範な視覚データセットの作成とマルチタスク学習を通じて、データの不完全性や統一的なアーキテクチャの欠如といった問題を解決しました。