腾讯与广州医学科研机构联合研发的DeepGEM病理大模型,仅用常规病理切片图像即可在1分钟内预测肺癌基因突变,精准度达78%-99%。该技术突破传统依赖基因测序的模式,通过AI分析图像识别潜在突变,为精准医疗提供高效新方案。
谷歌推出医疗AI开发工具包HAI-DEF,包含MedGemma和MedSigLIP两大开放模型。MedGemma27B多模态模型支持医疗文本生成和电子病历分析,MedSigLIP则擅长医学图像分类检索。这些模型可在单GPU运行,支持本地部署和微调,确保数据隐私和定制需求。相比API模型,开放架构让开发者能灵活应对医疗场景的特殊要求,如隐私保护和性能优化。项目提供详细教程,支持Hugging Face和Vertex AI平台部署。
近日,国内知名医疗大模型评测平台 MedBench 公布了最新榜单,其中,蚂蚁医疗团队研发的蚂蚁医疗大模型凭借卓越表现,一举夺得了评测榜单和自测榜单的双料冠军,分别以97.5和98.2的高分引发了业界的广泛关注。蚂蚁医疗大模型的成功离不开其团队在医疗推理模型研发上的不断努力。该团队近期采用了基于强化学习的技术,打造了新一代的医疗推理模型。这一创新使得该模型不仅具备了较强的 “医学思维” 推理能力,还能实现多模态交互,支持图像、文本、音频和视频等多种形式的输
在医学领域,影像数据的分析一直是一个复杂而繁琐的过程。最近,威尔康奈尔医学院的研究人员开发出了一种名为 LILAC(基于学习的纵向影像变化推断)的全新人工智能系统,能够高效、准确地分析和检测随时间变化的医学影像。这项研究于2月20日发表于《美国国家科学院院刊》,并展示了 LILAC 在多个医学场景中的广泛应用潜力。传统的医学影像分析方法往往需要大量的定制和预处理。以脑部 MRI 数据为例,研究人员通常需要花费大量时间对图像进行调整和修正,以便专注于某个特定的
大规模多模态医学数据集
医学AI能力开放共享平台
iszt
这是一个基于DINOv2预训练的视觉变换器模型,专门针对视网膜彩色眼底照片进行优化。该模型在MEH AlzEye数据集子集上训练,提供与Hugging Face Transformers兼容的格式,便于进行视网膜图像特征提取和下游医学影像任务。
chaoyinshe
EchoVLM是一个专为医学超声领域设计的动态专家混合视觉语言模型,能够处理图像和文本输入并生成文本输出,在超声智能诊断中具有重要应用价值。
tristan-deep
这是一个基于分数生成扩散模型的医学图像处理模型,专门针对心脏超声图像进行去雾处理。该模型在DehazeEcho2025数据集上训练,能够有效去除超声图像中的雾状干扰,提升图像清晰度。
UCSC-VLAA
MedVLThinker-7B-RL_m23k是一个基于Qwen2.5-VL的医学视觉语言模型,拥有70亿参数,利用强化学习在Med23k数据集上进行训练,专门用于处理医学图像与文本的交互任务。
lingshu-medical-mllm
灵枢是一款在医疗领域表现卓越的多模态大语言模型,能有效处理医学图像和文本信息,在医疗问答和报告生成任务中展现出了顶尖性能。
Mungert
MedGemma-4B-IT是基于Gemma 3的医学领域多模态模型,支持医学文本和图像理解,适用于医疗AI应用开发。
unsloth
MedGemma是基于Gemma 3开发的医学多模态模型,专注于医学文本和图像理解,支持构建医疗保健AI应用。
mlx-community
MedGemma-4B-IT-4bit 是一个专为医学领域设计的视觉语言模型,支持图像和文本处理,适用于医学图像分析等任务。
MedGemma是基于Gemma 3的医疗专用多模态模型,擅长医学文本和图像理解,支持胸部X光、皮肤科、眼科等多种医学影像分析。
MedGemma是Google开发的医疗专用多模态AI模型,基于Gemma 3架构,专注于医学文本和图像理解。
google
MedGemma是Google开发的针对医学文本和图像理解优化的Gemma 3变体,提供4B和27B两个版本,专为医疗AI应用设计。
MedGemma是基于Gemma 3优化的医学多模态模型系列,专为医学文本和图像理解设计,提供4B和27B两种参数规模版本。
MedGemma是基于Gemma 3优化的医学多模态模型,专为医疗文本和图像理解设计,提供4B和27B两个版本。
prithivMLmods
这是一个基于google/siglip2-base-patch16-224架构的二分类图像模型,专门用于检测骨骼X光图像中的骨折情况。该模型在医学诊断、临床分诊和放射学辅助系统中具有重要应用价值。
nezahatkorkmaz
基于微软LLaVA-Med v1.5 (Mistral 7B)架构,专为支持土耳其语的医学图像视觉问答(VQA)而定制
dumbequation
Llama3.2 11B视觉模型是基于医学数据集微调的视觉问答模型,特别适用于放射学和皮肤癌图像分析。
stanfordmimi
由六种大规模、可泛化的2D/3D变分自编码器组成的医学影像处理模型家族,能够将医学图像编码为压缩的潜在表征,并实现高保真度的图像重建。
wisdomik
GenMedClip 是一个基于 open_clip 库的零样本图像分类模型,专注于医学图像分析。
AnikiFan
基于 PyTorch 的 Linknet 架构实现的图像语义分割模型,适用于医学影像等领域的像素级分类任务
0llheaven
基于DETR架构的医学图像目标检测模型,专门用于胸部X光图像分析,可检测肺炎及其类型。
MCP-Slicer是一个将3D Slicer与模型客户端(如Claude)通过MCP协议连接的集成工具,支持通过自然语言直接操作3D Slicer进行医学图像处理和场景控制。