AI 视频生成与编辑领域迎来底层逻辑的重构。字节跳动商业化技术团队近日正式开源了面向视频生成与视频编辑的统一框架——
传统的视频编辑往往面临主体变形、背景漂移或动作断裂等技术瓶颈。为了打破这一僵局,

得益于这一分工,
除了文本操控,
为了解决多视觉片段串联时模型容易认混的难题,团队还引入了 SA-3D RoPE 位置编码机制,赋予不同视觉片段专属标记,从而在保留时空位置关系的同时分清参考素材与输出目标。目前,在字节自建的测试中,该框架已稳居行业第一梯队。据悉,
AI 视频生成与编辑领域迎来底层逻辑的重构。字节跳动商业化技术团队近日正式开源了面向视频生成与视频编辑的统一框架——
传统的视频编辑往往面临主体变形、背景漂移或动作断裂等技术瓶颈。为了打破这一僵局,

得益于这一分工,
除了文本操控,
为了解决多视觉片段串联时模型容易认混的难题,团队还引入了 SA-3D RoPE 位置编码机制,赋予不同视觉片段专属标记,从而在保留时空位置关系的同时分清参考素材与输出目标。目前,在字节自建的测试中,该框架已稳居行业第一梯队。据悉,
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
联想推出AI主机300,面向中小企业及超级个体,售价26999元,6月18日上线。该机搭载AMD锐龙AI Max+395处理器、128GB内存与2TB SSD,以高性能硬件与深度AI平台,解决成长型业务在数据处理与内容创作中的效率痛点。
企业AI落地面临高效低成本难题。青云科技旗下基石智算平台接入国产开源大模型MiniMax-M3,提供新算力支持。MiniMax-M3以卓越上下文处理能力等三大核心技术见长,依托自研架构,助企业便捷部署AI业务。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、通义实验室联合开源首个统一科学大模型LOGOS,1B参数性能超越NatureLM通义实验室联合开源首个统一科学大模型LOGOS,1B参数性能超越NatureLM。8、语音交互大升级:Claude酝酿多语言支持,通话式体验呼之欲出ClaudeAI助手即将进行语音交互的重大升级,新增多语言支持和更自然的交互模式,为用户带来更流畅的使用体验。

钉钉组织架构大调整,成立核心平台业务部并整合AI Agent团队。原悟空与MuleRun合并为新悟空团队,由束骏亮负责,推动企业协同办公智能化。

成立仅一年的世界模型公司Manifold AI(流形空间)宣布完成数亿元融资,获得国新基金、毅峰资本、北汽产投及芯能创投等新机构支持,四家老股东超额追加。在AI竞速加剧的背景下,其高速成长备受资本认可。

阿里 ATH-Token Foundry 联合中国人民大学高瓴人工智能学院开源科学基础模型 LOGOS。该模型采用统一科学语法与纯序列建模范式,在六大科学任务上匹配或超越传统专用方法。其中 LOGOS-1B 仅 1B 参数,即展现出极高效率,性能超越参数量达 8×7B 的微软模型。
网易云音乐旗下“妙时”(含AI奇遇)AI情感陪伴应用发布停运公告,将于7月14日0时全面停止服务。客服回应属正常业务调整,不影响其他产品。目前已停止新用户注册和充值,用户可在8月14日前申请退还剩余代币和会员费,并导出AI恋人聊天记录。
Anthropic 正为 Claude 升级语音模式,突破英语限制,新增中文、粤语、日语、德语等多语种支持,提升多语言交互体验。
曹操出行在香港车博会上宣布启动香港自动驾驶出租车业务,发布RoboX战略,宣告向AI全面转型,致力打造全球领先物理人工智能移动科技平台。香港作为首个标杆城市,探索国际化智能运力体系。活动展出中国首款原生自动驾驶出租车车型Eva Cab,标志RoboX战略正式落地。

阿里与人大联合开源多领域科学基础模型LOGOS,通过构架通用“科学语法”,统一蛋白质、小分子、复杂材料等异构数据的表征与生成,打破学科间语言鸿沟,为AI驱动科研提供跨领域基础模型支撑。