AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
数据集市
ZH

AI资讯

查看更多

英伟达推多模态LLM Describe Anything:指定特定区域生成详细的描述

NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B(DAM-3B),专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能,在多模态学习领域掀起热议,成为AI技术发展的又一里程碑。以下,AIbase为您梳理这款模型的核心亮点与行业影响。区域化描述的突破DAM-3B以其独特的能力脱颖而出:能够根据用户指定的图像或视频区域(如点、框、涂鸦或掩码),生成高度详细的描述。这种区域化描述超越了传统图像标注的局限,结合全局图像/视频上下文与局

15.6k 5 分钟前
英伟达推多模态LLM Describe Anything:指定特定区域生成详细的描述

模型

查看更多

DAM 3B Self Contained

nvidia

D

DAM-3B是一个能够根据用户指定的图像区域(点/框/涂鸦/掩码)生成精细化局部描述的视觉语言模型。

多模态SafetensorsSafetensors英语
nvidia
824
17

DAM 3B Video

nvidia

D

DAM-3B-Video是一个30亿参数的视觉语言模型,能够根据用户指定的图像/视频区域生成精细化局部描述。

多模态SafetensorsSafetensors英语
nvidia
426
42

DAM 3B

nvidia

D

DAM-3B是一个30亿参数的视觉语言模型,能够根据用户指定的图像区域生成精细化局部描述。

多模态SafetensorsSafetensors英语
nvidia
1.4k
81
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图