中国チームが世界最大規模のマルチモーダルデータセット「Infinity-MM」と最先端の小型AIモデル「Aquila-VL-2B」を発表
複数の中国の研究機関からなる研究チームが、世界最大規模の公開マルチモーダルAIデータセットの一つである「Infinity-MM」データセットの作成に成功し、同時に、優れた性能を持つ小型の新モデル「Aquila-VL-2B」を開発しました。このデータセットは、主に1000万件の画像キャプション、2440万件の一般的なビジュアル指示データ、600万件の高品質な厳選された指示データ、そしてGPT-4やその他のAIモデルによって生成された300万件のデータの4つのカテゴリーで構成されています。