医学多模态数据集MedTrinity-25M:包含2500万张医学影像
"MedTrinity-25M" 是由 UCSC-VLAA 团队发布的一个大规模多模态医学数据集,包含2500万张医学影像及其详细注释。该数据集具有多粒度注释,支持医学多模态大模型训练,其构建过程复杂,通过数据处理、元数据提取、感兴趣区域定位及医学知识收集,利用大规模语言模型生成详细描述,提高数据可用性。数据集于2024年7月21日正式发布,配套提供预训练模型,如LLaVA-Med++,在医学任务中表现出色,为医学研究提供强大支持。此数据集是医学研究领域的重要资源,旨在促进医学研究的发展。