醫學多模態數據集MedTrinity-25M:包含2500萬張醫學影像
"MedTrinity-25M" 是由 UCSC-VLAA 團隊發佈的一個大規模多模態醫學數據集,包含2500萬張醫學影像及其詳細註釋。該數據集具有多粒度註釋,支持醫學多模態大模型訓練,其構建過程複雜,通過數據處理、元數據提取、感興趣區域定位及醫學知識收集,利用大規模語言模型生成詳細描述,提高數據可用性。數據集於2024年7月21日正式發佈,配套提供預訓練模型,如LLaVA-Med++,在醫學任務中表現出色,爲醫學研究提供強大支持。此數據集是醫學研究領域的重要資源,旨在促進醫學研究的發展。