数字人点燃亚运主火炬,从这篇 ICCV 论文透视蚂蚁的生成式 AI 黑科技

微信公众平台
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
全球知名AI视频平台HeyGen正式发布Avatar IV数字人模型。基于创新的“扩散式音频驱动表情引擎”,用户仅需一张照片、一段30秒内的语音或文本脚本,即可生成高度逼真的数字人视频,表情、动作与语义情感深度同步,引发行业广泛关注。逼真演绎,源于先进技术内核Avatar IV仅需用户上传一张照片(支持侧脸及多角度图像)和30秒内的语音/脚本,即可生成动态数字人。新模型通过分析语音的节奏、语调及情绪,驱动数字人的面部表情、微动作(如点头、停顿)及肢体语言,显著提升真实感。例
根据亚马逊网络服务(AWS)最新发布的报告,全球 IT 领导者在2025年的预算中,生成式 AI 的投资优先级已超过网络安全。该报告的数据显示,45% 的企业计划优先考虑生成式 AI 支出,而网络安全工具的预算仅为30%。这一转变标志着企业在追求 AI 转型潜力的过程中,策略发生了显著变化。图源备注:图片由AI生成,图片授权服务商MidjourneyAWS 发布的《生成式 AI 采纳指数》调查了来自九个国家的3739名 IT 高管,结果显示,90% 的企业已在不同程度上部署了生成式 AI 技术。其中,44% 的企业已经从实
近日,AI数字人科技公司硅基智能宣布1000万美元收购稀缺四字母.com域名DUIX.com。与域名收购同步进行的,是硅基智能旗下同名数字人实时交互平台的正式上线。据介绍,新推出的平台名为DUIX,全称Dialogue User Interface System,旨在定位为新一代数字人智能交互基础设施。该平台将为开发者提供一整套便捷的工具和服务,包括API接入、SDK开发包,同时还设置了免费的实时体验入口及丰富的多场景应用案例供参考。图源备注:图片由AI生成,图片授权服务商MidjourneyDUIX平台的核心能力在于支持数字
近日,LemonAI 正式发布其最新产品——Slice Live,这是一款全球首创的实时音视频 AI 模型,凭借突破性技术,用户仅需上传一张照片,即可与任意虚拟角色进行实时视频通话。据 LemonAI 官方介绍,Slice Live 采用先进的 Transformer 模型,每秒25帧的速率实时渲染屏幕上的每一个像素。这种高效的生成能力确保了画面流畅性和真实感,无论是虚拟角色的面部表情、动作,还是与用户的语音互动,都能达到近乎实时的自然效果。用户上传的单张照片即可被快速转化为一个栩栩如生的数字人,无需复杂
腾讯在世界读书日当天正式上线了一款名为“企鹅读伴”的AI阅读助手。这是由腾讯混元大模型和腾讯元器平台提供技术支持的创新产品,由腾讯SSV数字支教实验室主导研发设计,旨在为中小学生带来一场充满科技感与趣味性的阅读新体验。
在人工智能(AI)领域的快速发展中,技术人才的专业知识变得愈发重要。位于加利福尼亚圣克拉拉的 Interview Kickstart 近日宣布更新其 “应用生成式 AI” 课程,旨在帮助技术专业人士适应这一快速演变的市场。这个消息恰逢中国科技巨头百度推出其新一代 AI 模型 ——Ernie4.5和 Ernie X1,引发了业界的广泛关注。百度的这两款多模态基础模型声称在多个基准平台上超过了竞争对手,如 DeepSeek 和 OpenAI。这一突破标志着中国 AI 市场竞争的加剧,DeepSeek、阿里巴巴、腾讯和字节跳动等公司都在争夺
今日,百度创始人李彦宏的25年首场演讲海报正式曝光。根据海报信息,李彦宏将在4月25日的Create2025百度AI开发者大会上带来一场为期1小时的主题演讲,题为《模型的世界,应用的天下》。演讲内容将聚焦AI领域的热门议题,包括MCP、智能体、数字人、模型成本等,引发业界广泛关注。此次大会的亮点之一是李彦宏将正式发布百度AI的最新产品和业务进展。此前,百度已预告将在大会上推出文心大模型4.5Turbo,海报暗示李彦宏将在演讲中详细介绍该模型的独特功能与技术能力。文心大模型4.
位于旧金山的 Virtue AI 公司近日宣布完成3000万美元的种子轮和 A 轮融资。这轮融资由 Lightspeed Venture Partners 和 Walden Catalyst Ventures 领投,同时吸引了包括 Prosperity7在内的多位投资者。Virtue AI 致力于消除企业在 AI 创新与安全之间的传统权衡,帮助企业安全高效地部署生成式 AI 技术。Virtue AI 的创始团队由多位在 AI 安全和安全领域享有盛誉的专家组成,包括 Bo Li、Dawn Song、Carlos Guestrin 和 Sanmi Koyejo。他们在 AI 安全领域积累了超过80年的研究经验,深知企业在快速创新和安全合规之间面临的挑战
阿里通义实验室近日发布了一款名为 “OmniTalker” 的新型数字人视频生成大模型。这一创新模型的核心在于其能够通过上传一段参考视频,实现对视频中人物的表情、声音和说话风格的精准模仿。相较于传统的数字人制作流程,OmniTalker 显著降低了制作成本,同时提升了生成内容的真实感和互动体验,满足了广泛的应用需求。OmniTalker 的使用十分简便,用户只需在平台上上传一段参考视频,就能生成与之同步的音频和视频内容。目前,该项目已在魔搭社区和 HuggingFace 等平台开放体验,并提
最近,苏宁易购宣布在其 Max 店引入全新的店员 AI 助手和数字人导购屏系统。这一创新通过将灵大模型与 DeepSeek 技术深度融合,建立起 “双引擎” 智能服务体系,旨在全面提升门店运营效率、用户服务体验和营销转化效果。据苏宁易购的 IT 负责人介绍,凭借零售大模型技术,公司整合了大量的门店商品、用户画像及营销活动数据,创建了智能化的门店知识库系统。店员现在只需输入关键词,便可以在一秒钟内获取精准的信息。相比以前处理问题的4小时 / 件,现在已经缩短至仅需1分钟 /