AIBase
Home
AI NEWS
AI Tools
AI Models
MCP
AI Services
AI Compute
AI Tutorial
Datasets
EN

AI News

View More

DeepSeek-AI开源DeepSeek-VL2系列:3B、16B 和27B参数三种模型

随着人工智能的快速发展,视觉与语言能力的整合引发了视觉语言模型(VLMs)的突破性进展。这些模型旨在同时处理和理解视觉与文本数据,广泛应用于图像描述、视觉问答、光学字符识别以及多模态内容分析等场景。VLMs 在开发自主系统、增强人机交互以及高效文档处理工具方面发挥了重要作用,成功地弥合了这两种数据模态之间的差距。然而,在高分辨率视觉数据和多样化文本输入的处理上,仍然存在许多挑战。目前的研究已经部分解决了这些限制,但大多数模型采用的静态视觉编码

20.9k 7 hours ago
DeepSeek-AI开源DeepSeek-VL2系列:3B、16B 和27B参数三种模型

Models

View More

Reka Flash 3

reka-ai

Reka Flash 3

-

Input tokens/M

-

Output tokens/M

128k

Context Length

InternVideo2 Stage2_6B

OpenGVLab

I

InternVideo2是一个多模态视频理解模型,具有6B参数规模,专注于视频内容分析和理解任务。

多模态SafetensorsSafetensors
OpenGVLab
542
0
AIBase
Empowering the future, your artificial intelligence solution think tank
English简体中文繁體中文にほんご
FirendLinks:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
Business CooperationSite Map