AI 视频生成与编辑领域迎来底层逻辑的重构。字节跳动商业化技术团队近日正式开源了面向视频生成与视频编辑的统一框架——
传统的视频编辑往往面临主体变形、背景漂移或动作断裂等技术瓶颈。为了打破这一僵局,

得益于这一分工,
除了文本操控,
为了解决多视觉片段串联时模型容易认混的难题,团队还引入了 SA-3D RoPE 位置编码机制,赋予不同视觉片段专属标记,从而在保留时空位置关系的同时分清参考素材与输出目标。目前,在字节自建的测试中,该框架已稳居行业第一梯队。据悉,
AI 视频生成与编辑领域迎来底层逻辑的重构。字节跳动商业化技术团队近日正式开源了面向视频生成与视频编辑的统一框架——
传统的视频编辑往往面临主体变形、背景漂移或动作断裂等技术瓶颈。为了打破这一僵局,

得益于这一分工,
除了文本操控,
为了解决多视觉片段串联时模型容易认混的难题,团队还引入了 SA-3D RoPE 位置编码机制,赋予不同视觉片段专属标记,从而在保留时空位置关系的同时分清参考素材与输出目标。目前,在字节自建的测试中,该框架已稳居行业第一梯队。据悉,
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
豆包App上线内置“豆包导航”功能,底层采用百度地图技术,实现端内原生导航体验。该功能按场景差异化服务:步行与骑行可直接在豆包内完成导航,也可选高德地图。此举拓展了AI大模型在出行场景的应用边界。

AI编程工具Cursor在传出被SpaceX收购后,随即推出移动应用“Cursor Mobile”,使开发者能通过手机随时随地启动与指导AI编码代理。该应用契合其向独立编码代理的转型,用户既可新建代理,也可与桌面端正在运行的代理保持实时连接。
美国参议员沃伦与众议员斯坎伦计划推出升级版《健康与位置数据保护法案》,应对人工智能深入医疗和日常交互带来的隐私新威胁。法案除延续禁止数据经纪商买卖特定敏感信息外,首次将用户输入AI系统的私密数据纳入监管,旨在填补AI时代的隐私保护空白。
哈萨比斯在戛纳广告节上回应技术瓶颈质疑,称DeepMind仍拥有最强AI团队。他认为,通向通用人工智能远非单纯扩大语言模型,核心在于整合推理、规划等高阶思维,并强调需肩负行业责任。

谷歌宣布向全美免费用户开放Gemini平台个性化AI图像生成功能,昔日付费独享走向大众。用户现可自定义并锁定专属视觉风格,告别每次生成时需重复描述画风与背景的繁琐,让创作更加高效。
前Facebook高管查马斯·帕里哈皮蒂亚创立的AI编程初创公司8090Labs完成1.35亿美元A轮融资,由Salesforce Ventures领投,WndrCo、Craft Ventures及多位科技领袖参投,帕里哈皮蒂亚将全职出任CEO。
Meta因知识产权保护考量,禁止AI工程师使用Claude Code及Codex等外部编程模型,非为成本或效率,凸显科技巨头在算力算法竞争外,对自研技术保密性的强化。

苹果承认AI加速网络攻击工具开发,缩短漏洞利用窗口,因此调整操作系统更新机制,将原本需大版本推送的安全补丁提前开放。此举以应对传统集中发布模式失效的风险,提升用户防护时效性。

AI辅助编码公司Cursor推出移动应用,让开发者通过手机与远程AI编码代理实时协作,延续其2.0版转向独立代理的战略。该发布紧随SpaceX以600亿美元收购之后,凸显Cursor资金底气与行业破局野心。
OpenAI 近日成立专项组,调查 Codex 额度异常消耗。多名付费用户反馈周额度跳水式下降,未使用即从 96% 迅速清零。产品负责人 Tibo Sottiaux 公开回应,已紧急启动作战室全面排查后端日志,并着手缓解用户影响。