AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI资讯

查看更多

多模态模型新突破:李飞飞团队统一动作与语言,不仅超懂指令,还能读懂隐含情绪

李飞飞团队推出了一种新的多模态模型,该模型能够理解和生成人类的动作,并通过结合语言模型,实现了对口头和非口头语言的统一处理。 这一突破性的研究,使得机器不仅可以理解人类的指令,还能读懂动作中蕴含的情绪,从而更自然地进行人机交互。该模型的核心在于其多模态语言模型框架,能够接收音频、动作和文本等多种形式的输入,并输出所需的模态数据。 结合生成式预训练策略,该模型在多个任务上展现出卓越的性能。 例如,在协同语音手势生成方面,该模型不仅超越了

14.9k 1 天前
多模态模型新突破:李飞飞团队统一动作与语言,不仅超懂指令,还能读懂隐含情绪

模型

查看更多

Qwen3-Next-80B-A3B-Instruct

Alibaba

Qwen3-Next-80B-A3B-Instruct

$2

输入tokens/百万

-

输出tokens/百万

256

上下文长度

Qwen_v2.5_7b_base

Alibaba

Qwen_v2.5_7b_base

$2

输入tokens/百万

-

输出tokens/百万

128

上下文长度

ERNIE X1.1 Preview

Baidu

ERNIE X1.1 Preview

$1

输入tokens/百万

$4

输出tokens/百万

64

上下文长度

Gemma 2 9B

Google

Gemma 2 9B

$1

输入tokens/百万

-

输出tokens/百万

-

上下文长度

AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商务合作网站地图