AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

Valley 2.0

多模态大型语言模型，提升文本、图像和视频数据处理能力。

普通产品其他多模态大型语言模型

Valley是由字节跳动开发的多模态大型模型（MLLM），旨在处理涉及文本、图像和视频数据的多种任务。该模型在内部电子商务和短视频基准测试中取得了最佳结果，远超过其他开源模型，并在OpenCompass多模态模型评估排行榜上展现了出色的性能，平均得分67.40，位列已知开源MLLMs（<10B）中的前两名。

Valley 2.0

Valley 2.0 最新流量情况

月总访问量

188

跳出率

50.00%

平均页面访问数

2.4

平均访问时长

00:02:21

Valley 2.0 访问量趋势

Valley 2.0 访问地理位置分布

Valley 2.0 流量来源

Valley 2.0 替代品

Valley 2.0 — 多模态大型语言模型，提升文本、图像和视频数据处理能力。

•多模态•大型语言模型

InternVL2_5-78B-MPO — 这是一个先进的多模态大型语言模型系列，展示了卓越的整体性能。

•多模态•大型语言模型

MinMo — MinMo是一款多模态大型语言模型，用于无缝语音交互。

•语音交互•多模态

InternVL2_5-38B-MPO — InternVL2.5-MPO系列模型，基于InternVL2.5和混合偏好优化，展现卓越性能。

•多模态•大型语言模型

InternVL2_5-26B-MPO-AWQ

InternVL2_5-26B-MPO-AWQ — 先进的多模态大型语言模型，具备卓越的多模态推理能力。

•多模态•大型语言模型

InternVL2_5-26B-MPO — 多模态大型语言模型，提升视觉与语言的交互能力。

•多模态•大型语言模型

InternVL2_5-8B-MPO-AWQ — 多模态大型语言模型，提升视觉与语言的交互能力

•多模态•大型语言模型

InternVL2_5-8B-MPO — 多模态大型语言模型，展示卓越的整体性能。

•多模态•大型语言模型

InternVL2_5-4B-MPO-AWQ — 多模态大型语言模型，优化图像与文本交互能力

•多模态•大型语言模型

InternVL2_5-4B-MPO — 多模态大型语言模型，展示卓越的整体性能

•多模态•大型语言模型

InternVL2_5-2B-MPO

InternVL2_5-2B-MPO — 先进的多模态大型语言模型

•多模态•大型语言模型

InternVL2_5-1B-MPO — 多模态大型语言模型，提升视觉和语言的综合理解能力

•多模态•大型语言模型

InternVL 2.5 — 开源多模态大型语言模型系列

•多模态•大型语言模型

InternVL2_5-4B — 多模态大型语言模型，融合视觉与语言理解。

•多模态•大型语言模型

InternVL2_5-2B — 多模态大型语言模型，支持图像与文本的深度交互

•多模态•大型语言模型

InternVL2_5-1B — 多模态大型语言模型，支持图像和文本理解

•多模态•大型语言模型

InternVL2_5-8B — 多模态大型语言模型，支持图像与文本的交互理解。

•多模态•大型语言模型

InternVL2_5-26B — 多模态大型语言模型，融合视觉与语言理解。

•多模态•大型语言模型

InternVL2_5-38B — 先进的多模态大型语言模型系列

•多模态•大型语言模型

InternVL2_5-78B — 先进多模态大型语言模型系列

•多模态•大型语言模型

Pixtral-Large-Instruct-2411 — 124B参数的多模态大型语言模型

•多模态•大型语言模型

ultravox-v0_4_1-llama-3_1-70b — 多模态语音大型语言模型

•语音识别•文本生成

Ferret-UI-Llama8b — 基于Llama-3-8B的多模态大型语言模型，专注于UI任务。

•多模态•大型语言模型

MM1.5 — 多模态大型语言模型的优化与分析

•多模态•大型语言模型

NVLM 1.0

NVLM 1.0 — 前沿级多模态大型语言模型

•多模态•大型语言模型

NVLM-D-72B — 前沿的多模态大型语言模型

•多模态•大型语言模型

Llama-3.2-11B-Vision — 多模态大型语言模型，支持图像和文本处理。

•多模态•图像处理

mPLUG-Owl3 — 多模态大型语言模型，理解长图像序列。

•多模态•图像理解

OmAgent — 多模态智能代理框架，解决复杂任务

•多模态•智能代理

Cantor — 创新的多模态链式思维框架，提升视觉推理能力

•多模态•视觉推理