MoMask:文本驱动的3D人体动作生成模型
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
中科大与字节跳动联合推出端到端长视频生成模型,能直接生成分钟级、480p分辨率、24fps的高质量视频,支持多镜头切换。核心创新是底层算法MoGA,这是一种全新注意力机制,专攻长视频生成难题,标志着国产视频生成技术实现关键突破。

Meta将AI图像编辑功能直接整合进Instagram Stories,用户只需输入文字指令即可添加、删除或改造照片与视频内容。此前该功能仅限与聊天机器人互动使用,现通过界面顶部的“Restyle”菜单直接操作,简化了编辑流程。
阿里巴巴升级Qwen Deep Research工具,用户可在网页版Qwen Chat中一键生成带引文的研究报告、交互式网页和多说话者播客,实现从数据分析到多格式内容输出的完整闭环,仅需1-2次点击。

字节跳动Seed团队近日宣布推出3D生成大模型Seed3D1.0,该模型能够从单张图像端到端地生成高质量仿真级3D模型,包括精细几何、真实纹理和基于物理渲染(PBR)材质。这一创新成果有望为具身智能的发展提供强大的世界模拟器支持,解决当前技术在物理交互能力和内容多样性方面的瓶颈问题。 在研发过程中,Seed团队收集并处理了大规模的高质量3D数据,构建了完整的三阶段数据处理管线,将海量异构的原始3D数据转化为高质量训练集。Seed3D1.0采用基于Diffusion Transformer架构的模型,通过端到端的技术路线,实现从单张图像到

微软在Photos应用中推出两项AI新功能:Restyle Image和Image Creator,目前仅限Copilot+电脑使用。Restyle Image可智能重塑照片艺术风格,Image Creator支持AI生成图像,旨在提升用户编辑和创作能力,简化图像处理流程。

特斯拉2025年第三季度营收280.95亿美元,同比增长11.57%创季度新高,但净利润13.73亿美元同比下滑36.81%。CEO马斯克在财报会转向人工智能与机器人业务,称公司处于“现实世界人工智能的关键转折点”,强调特斯拉在该领域的领先地位。
MiniMax将发布视频生成模型Hailuo2.3,在真实感、精准度和风格多样性上实现重大突破,被视为AI视频生成领域的飞跃。该模型继年初Hailuo02超越谷歌Veo3后,2.3版本在动作捕捉等方面进一步提升性能,巩固其行业领先地位。
OpenAI公布Sora视频生成工具路线图,将推出角色客串功能,支持宠物、玩具等对象出演视频,并升级创作工具与社交体验,推动AI视频创作多样化发展。

近日,生数科技正式宣布 Vidu Q2参考生视频大模型 API 全面开放接入,这一举措标志着 AI 视频生成技术从“可用”迈向“精工”的关键跃迁。Vidu Q2在保持超高一致性方面展现出了独特价值,尤其在广告、商品展示等领域,不仅能够精准还原产品细节,还能为 AI 视频注入情感表现力,从而提升品牌好感与用户转化。 Vidu Q2的发布为互动娱乐、动漫、广告电商行业带来了全新的武器。其首创的“创意特效引擎”为这些行业提供了引爆节日流量、制胜全球市场的新手段。Vidu Q2不仅在视频生成的真实感上树立了新标杆,还通过细微表情生成技术为数字角色注入真实情感,让 AI 视频迎来全新

火山引擎正式上线了豆包视频生成模型1.0pro(Doubao-Seedance-1.0-pro)的首尾帧能力,这一更新标志着AI视频创作在可控性和一致性方面迈出了重要一步。Seedance1.0pro凭借复杂场景主体一致性、大幅运动的物理合理性以及视频节奏智能推理等技术优势,将大幅提升生成视频的主角跟随效果,实现精准叙事引导,生成更具沉浸感及表现力的视频作品。 企业用户可以通过火山方舟调用Seedance1.0pro API体验该模型的首尾帧能力,而个人用户则可以在“火山方舟体验中心”直接体验。这一能力的推出,不仅为专业影像创作者提供了强大的工具,也为普通用户开启了AI视频创作的新大门。