医学多モーダルデータセットMedTrinity-25M:2500万枚の医学画像を含む
MedTrinity-25Mは、UCSC-VLAAチームによって公開された大規模な多モーダル医学データセットであり、2500万枚の医学画像とその詳細なアノテーションが含まれています。このデータセットは、多粒度のアノテーションを備えており、医学多モーダル大規模モデルのトレーニングをサポートします。その構築プロセスは複雑で、データ処理、メタデータ抽出、関心領域の特定、医学知識の収集を行い、大規模言語モデルを使用して詳細な説明を生成することで、データの可用性を向上させています。このデータセットは2024年7月21日に正式に公開され、事前トレーニング済みモデルも提供されています。