Captury推出创新3D体积扫描技术 实现真实动态捕捉
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
OpenAI宣布将停用GPT-4o等旧版模型,标志着该模型完成历史使命。GPT-4o曾因对话风格和多模态能力受好评,但公司重心已转向新一代旗舰模型,GPT-5.2成为用户首选。
游戏开发者大会调查显示,超过半数开发者认为生成式AI对游戏行业产生负面影响,仅7%持正面看法。行业内部对技术变革的焦虑情绪正快速蔓延,负面看法在过去三年呈爆发式增长。

蚂蚁集团发布LingBot-VLA模型,专注于机器人复杂操控,通过海量数据训练实现跨形态通用能力。研发团队在9种主流双臂机器人上采集约2万小时真实数据,涵盖丰富动作序列,推动具身智能领域进展。

字节跳动与阿里巴巴计划在春节前后发布新一代底层模型技术,竞争进入白热化。字节跳动将推出三款核心模型,涵盖语言处理、图像生成及视频领域,挑战市场格局。

昆仑万维开源视频生成大模型SkyReels-V3,实现参考图像转视频、视频延长及音频驱动虚拟形象三大功能集成。该模型支持1至4张参考图输入,能精准保留主体身份与构图,推动视频生成技术进入高保真、多模态新阶段。
OpenAI正秘密研发新型社交平台,主打生物识别技术以根除机器人账号,旨在打造纯真人社交环境,并借此推广ChatGPT和Sora。此举被视为对马斯克旗下X平台的反向挑战。

蚂蚁灵波科技开源世界模型LingBot-World,在视频质量、动态程度等关键指标媲美Google Genie3,为具身智能、自动驾驶等领域提供高保真、可实时操控的“数字演练场”。
谷歌将AI订阅服务Google AI Plus扩展至35个国家和地区,旨在以更具竞争力的价格推广其尖端生成式AI技术。该服务提供全方位的智能增强方案,包括Gemini 3 Pro模型和移动端优化的Nana Banana Pro图像生成工具。
MiniMax发布新一代音乐大模型Music2.5,通过技术创新显著提升AI音乐的专业性与听感。模型重点突破两大核心技术:段落级强控制,精准把握音乐结构,使乐曲逻辑更严密;物理级高保真,大幅提升音频质量。
Meta提出基于多模态感知的AI面部表情生成技术,通过分析用户身体动作、语音等多维度信息,在虚拟互动中实现自然生动的表情生成,克服了传统方案依赖昂贵硬件或仅同步音频的局限,尤其适用于用户活动复杂、面部遮挡或仅通过身体传达信息的场景。