信息

AI新闻资讯

探索AI前沿，掌握行业发展趋势

AI 商用·开源产品库

精准筛选产品，多维度产品调研

AI 产品排行榜

热门AI产品实力、热度、年/月/日排行

AI产品提交

提交AI产品信息，助力产品推广和用户转化

工具

AI工具导航

一站式AI工具指南，快速找到你需要的工具

信息

模型库

涵盖各类AI模型，满足你的开发与研究需求

大模型排行榜

热门AI大模型性能、热度、年/月/日排行

模型供应商

寻找优质模型提供商，获取可靠模型支持

模型服务提交

提交模型信息和服务，精准推广和触达用户

工具

大模型选型对比

多维度对比大模型，找到最适合你的模型

大模型费用计算器

精准计算大模型使用成本，合理规划预算

大模型竞技场

多模型实时评测，模型输出结果快速比对

信息

MCP服务端

聚集热门MCP服务，快速找到适合你的服务

MCP客户端

轻松接入MCP客户端，调用强大的AI能力

MCP教程与实践

学习MCP使用技巧，从入门到精通

MCP排行榜

热门MCP服务性能排行，帮你找到最佳选择

MCP服务提交

发布你的MCP服务，推广你的MCP服务

工具

MCP实验场

自由测试MCP服务，线上快速体验

MCP服务调试器

快速测试MCP服务，快速上线

GEO 大模型推荐优化

通过AI搜索优化服务，让品牌在AI中实现霸屏

GEO排名查询工具

检测品牌在AI平台中的可见度

工具

模型个人电脑配置检测器

一键检测电脑配置，研判运行模型的兼容性

信息

数据集合

提供用于训练、评估和测试模型的数据集

工具

智能文档识别解析

提供各类文档文字提取，支持自定义场景

AI应用指南

浙大与阿里联合发布OmniAvatar:音频驱动全身数字人模型震撼登场

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Jul 2, 2025

432

浙江大学与阿里巴巴联合推出全新音频驱动模型OmniAvatar，标志着数字人技术迈向新高度。该模型以音频为驱动，可生成自然流畅的全身数字人视频，尤其在歌唱场景下表现突出，口型与音频唇形同步精准，效果逼真。

OmniAvatar支持通过文本提示精细控制生成细节，用户可自定义人物动作幅度、背景环境及情绪表达，展现出极高的灵活性。此外，该模型能够生成虚拟人物与物体互动的视频，为电商广告、营销广告等商业场景提供了广阔应用空间。例如，品牌可利用OmniAvatar制作动态广告，增强消费者互动体验。

作为开源项目，OmniAvatar已在GitHub上发布，吸引了全球开发者的关注。其在面部表情、半身及全身动画生成上的优异表现，超越了现有同类模型。据悉，该模型还支持多场景应用，包括播客节目、人际互动及动态表演等，展现了其在内容创作领域的巨大潜力。

业界专家表示，OmniAvatar的发布不仅提升了音频驱动数字人技术的真实性与可控性，也推动了AI在营销、教育及娱乐等领域的创新应用。未来，浙江大学与阿里巴巴将继续深化合作，探索多模态AI的更多可能性。

OmniAvatar 浙江大学阿里巴巴数字人技术

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

一句话改变 AI 创作潜力:研究发现简单提示能显著提升输出多样性

斯坦福等大学团队提出“语言化采样”方法，通过在提示中要求模型“生成5个响应及其概率”，有效提升生成式AI的创作多样性。该方法适用于语言和图像模型，能激发更丰富的创造力输出。

2025年10月17号 16:08

190

重庆加强监管下架违规 AI 产品 10 余款确保技术安全

重庆开展人工智能滥用专项整治，已下架“AI开处方”等10多款违规产品。AI技术快速发展带来便利的同时，也出现虚假信息、数据安全等隐患，凸显监管重要性。

2025年10月17号 15:53

280

维基百科因 AI 聊天机器人流量下降，担忧可持续发展

维基媒体基金会指出，AI聊天机器人和搜索引擎导致维基百科人类访问流量下降，引发对其可持续发展的担忧。基金会呼吁AI工具和社交平台在使用维基百科内容时，应鼓励用户直接访问。

2025年10月17号 15:31

310

百度发布全球领先文档解析模型 PaddleOCR-VL，重塑OCR技术格局！

百度开源多模态文档解析模型PaddleOCR-VL，在OmniBenchDoc V1.5评测中以92.6分获全球第一。该模型仅0.9B参数，轻量高效，能精准识别文本、手写汉字、表格、公式及图表，四大核心能力表现卓越。

2025年10月17号 14:37

330

Strella 获 1400 万美元融资，推动 AI 面试技术革新客户研究

初创企业Strella完成1400万美元A轮融资，由Bessemer Venture Partners领投，多家机构参与。公司专注于AI驱动的客户研究平台，帮助亚马逊等企业高效收集反馈，解决传统方法耗时问题。创始人Lydia Hylton和Priya Krishnan均具顾问及产品背景。

2025年10月17号 10:02

160

阿里发布Qoder CLI命令行AI编程工具：内存占用降低70%，代码审查效率提升50%

阿里巴巴发布AI编程工具Qoder CLI，具备代码生成与理解能力，旨在提升开发效率、降低内存消耗和响应时间。开发者可通过命令行终端便捷使用，标志着阿里在编程工具领域的重要进展。

2025年10月17号 10:00

450

谷歌DeepMind 与耶鲁大学联合开发AI模型C2S-Scale 27B 癌症治疗路径

谷歌DeepMind与耶鲁大学联合开发27亿参数AI模型C2S-Scale27B，基于Gemma架构，专门分析细胞行为及癌细胞与免疫系统互动。该模型已在活细胞中验证新发现，为癌症治疗提供新思路，有望改变未来疗法设计。

2025年10月17号 9:25

250

字节跳动的豆包大模型：日均调用超30万亿tokens，增长势头惊人！

火山引擎总裁谭待披露，豆包大模型使用量从2024年5月的1200亿tokens激增至2025年9月的超30万亿tokens，增长253倍。这显示该模型迅速普及，在各行业应用潜力巨大，企业依赖度持续提升。

2025年10月16号 17:02

590

AI助手新突破！通义千问Qwen Chat Memory 正式上线，能 “记住” 你的每一次对话！

阿里云10月16日宣布通义千问Qwen Chat Memory正式上线，赋予AI助手“长记忆”能力。它能理解上下文、保留关键信息并主动回忆过往对话，提升交互体验，推动AI助手发展。

2025年10月16号 15:52

特斯拉 Optimus 机器人版童装上线，象征AI走进生活

特斯拉推出以人形机器人"擎天柱"为灵感的童装，配文"你的孩子现在也能打扮成我"，引发热议。此举被视为特斯拉推广机器人形象的趣味营销。CEO马斯克此前表示正加速推进该机器人的规模化生产。

2025年10月16号 14:53

490

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

模型库

大模型排行榜

模型供应商

模型服务提交

大模型选型对比

大模型费用计算器

大模型竞技场

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

GEO 大模型推荐优化

GEO排名查询工具

模型个人电脑配置检测器

数据集合

智能文档识别解析

浙大与阿里联合发布OmniAvatar:音频驱动全身数字人模型震撼登场

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

一句话改变 AI 创作潜力:研究发现简单提示能显著提升输出多样性

重庆加强监管下架违规 AI 产品 10 余款确保技术安全

维基百科因 AI 聊天机器人流量下降，担忧可持续发展

百度发布全球领先文档解析模型 PaddleOCR-VL，重塑OCR技术格局！

Strella 获 1400 万美元融资，推动 AI 面试技术革新客户研究

阿里发布Qoder CLI命令行AI编程工具：内存占用降低70%，代码审查效率提升50%

谷歌DeepMind 与耶鲁大学联合开发AI模型C2S-Scale 27B 癌症治疗路径

字节跳动的豆包大模型：日均调用超30万亿tokens，增长势头惊人！

AI助手新突破！通义千问Qwen Chat Memory 正式上线，能 “记住” 你的每一次对话！

特斯拉 Optimus 机器人版童装上线，象征AI走进生活

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

模型库

大模型排行榜

模型供应商

模型服务提交

大模型选型对比

大模型费用计算器

大模型竞技场

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

GEO 大模型推荐优化

GEO排名查询工具

模型个人电脑配置检测器

数据集合

智能文档识别解析

浙大与阿里联合发布OmniAvatar:音频驱动全身数字人模型震撼登场

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

一句话改变 AI 创作潜力:研究发现简单提示能显著提升输出多样性

​重庆加强监管 下架违规 AI 产品 10 余款确保技术安全

维基百科因 AI 聊天机器人流量下降，担忧可持续发展

百度发布全球领先文档解析模型 PaddleOCR-VL，重塑OCR技术格局！

Strella 获 1400 万美元融资，推动 AI 面试技术革新客户研究

阿里发布Qoder CLI命令行AI编程工具：内存占用降低70%，代码审查效率提升50%

谷歌DeepMind 与耶鲁大学联合开发AI模型C2S-Scale 27B 癌症治疗路径

字节跳动的豆包大模型：日均调用超30万亿tokens，增长势头惊人！

AI助手新突破！通义千问Qwen Chat Memory 正式上线，能 “记住” 你的每一次对话！

特斯拉 Optimus 机器人版童装上线，象征AI走进生活

重庆加强监管下架违规 AI 产品 10 余款确保技术安全