AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
数据集市
ZH

AI资讯

查看更多

DeepSeek-AI开源DeepSeek-VL2系列:3B、16B 和27B参数三种模型

随着人工智能的快速发展,视觉与语言能力的整合引发了视觉语言模型(VLMs)的突破性进展。这些模型旨在同时处理和理解视觉与文本数据,广泛应用于图像描述、视觉问答、光学字符识别以及多模态内容分析等场景。VLMs 在开发自主系统、增强人机交互以及高效文档处理工具方面发挥了重要作用,成功地弥合了这两种数据模态之间的差距。然而,在高分辨率视觉数据和多样化文本输入的处理上,仍然存在许多挑战。目前的研究已经部分解决了这些限制,但大多数模型采用的静态视觉编码

20.9k 9 小时前
DeepSeek-AI开源DeepSeek-VL2系列:3B、16B 和27B参数三种模型

模型

查看更多

Reka Flash 3

reka-ai

Reka Flash 3

-

输入tokens/百万

-

输出tokens/百万

128k

上下文长度

InternVideo2 Stage2_6B

OpenGVLab

I

InternVideo2是一个多模态视频理解模型,具有6B参数规模,专注于视频内容分析和理解任务。

多模态SafetensorsSafetensors
OpenGVLab
542
0
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图