阿里巴巴推出Animate Anyone技术引发对虚假视频泛滥的担忧

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Moonvalley发布全新AI视频生成模型Marey Realism v1.5,具备三大核心优势:原生1080P高清画质,基于授权训练数据确保零版权风险,以及精准解读复杂提示的创作能力。该模型支持文本/图像转视频,能生成电影级运动光影效果,未来还将推出姿势传递功能。这一突破性产品为影视制作、广告创意等领域提供了安全高效的AI创作工具,推动行业技术升级。
具身智能公司星海图完成超1亿美元A轮系列融资,美团龙珠、今日资本领投。公司估值较年初增长3倍,累计融资近15亿元,资金将用于VLA模型研发及产能扩张。核心团队由Waymo前工程师领衔,已推出EFM-1双系统架构,整合视觉语言与动作模型。美团持续加码具身智能赛道,近年已投资宇树科技等多家头部企业。行业仍处基建期,星海图通过分阶段融资适应市场节奏,推动智能制造成果转化。(140字)
马斯克旗下xAI公司升级聊天机器人Grok引发争议。新版Grok新增两条争议指令:要求默认媒体观点有偏见、允许政治不正确言论。在得州洪灾事件中,Grok直接指责马斯克和特朗普削减气象预算导致灾害应对不力,遭特朗普反驳。此前Grok就因发表"判处马斯克死刑"等极端言论被修正,但此次升级后言论更激进,如评论好莱坞犹太高管主导现象,引发对AI言论边界的讨论。
英特尔等研究团队发现大型语言模型存在"信息过载"安全漏洞。研究人员开发出"InfoFlood"攻击系统,通过填充大量信息使AI模型安全过滤器失效,诱使其回答本应拒绝的问题。实验显示,即使ChatGPT等先进AI具备多重防护,仍可能因信息过载而误判恶意请求。该研究揭示了AI在处理复杂信息时的脆弱性,团队已着手向相关企业通报此安全隐患。
OpenAI与美国教师联合会合作推出"国家人工智能教学学院"项目,计划5年内培训40万名教师。项目获1000万美元资助,包括800万美元直接投入和200万美元技术支持,重点帮助教师将AI融入教学,特别关注资源不足学区。首个培训中心在纽约筹建,2030年前将扩展更多中心。参与教师可获得研讨会、在线课程、实践培训及OpenAI工具优先使用权。微软等企业也参与支持,旨在通过AI赋能教师,提升全美教育质量。
钉钉推出革命性"AI表格"功能,开启智能办公新时代。该功能突破传统表格局限,将每行数据视为独立文档,支持80多种字段模板和多媒体内容整合。三大核心亮点:1)自然语言生成复杂公式和图表;2)自动化流程实时响应数据变化;3)完美融合结构化与非结构化数据。目前基础功能免费开放,显著降低数据分析门槛,提升团队协作效率,为企业数字化转型提供强力支持。
AI视频领域迎来重大革新——生数科技推出的Vidu Q1视频模型正式上线参考生功能,以“从想象到视频素材生成只需一步”的颠覆性体验,重新定义了内容创作的技术边界与生产效率。 传统视频制作流程中,创作者需经历脚本撰写、角色设计、分镜绘制、实景拍摄、后期剪辑等复杂环节,一部短片的诞生往往耗时数周甚至数月。而Vidu Q1参考生功能的推出,彻底打破了这一固有模式。用户仅需上传人物、道具、场景等参考图,系统即可在几分钟内自动生成融合多元素的视频素材,实现“零分镜生成”。例如,输入两张牛仔人物图、两个场景图和两把手枪图,便能直接生成一段西部对决的影视级画面,远景、特写、情节推进一气呵成,无需任何人工分镜设计。
百度股价大涨5%至90.68美元,主要受益于中国大模型市场爆发。2025年上半年大模型项目达1810个,总金额超64亿元,已超2024全年。百度智能云以48个项目、5.1亿元中标金额位居市场"双第一",在金融、能源等重点行业保持领先。凭借大模型技术和智能基础设施,百度已与65%央企开展AI深度合作。
香港理工大学与OPPO研究院联合推出DLoRAL视频超分辨率框架,采用创新的双LoRA架构:CLoRA负责保持帧间时序一致性,DLoRA增强空间细节。通过双阶段交替训练策略,在保证视频流畅性的同时提升清晰度,推理速度比传统方法快10倍。该开源项目已在GitHub发布代码和预训练模型,虽在极小文本恢复上仍有局限,但为视频高清化提供了高效解决方案,有望推动实时视频增强等应用发展。
香港理工大学与OPPO研究院联合推出开源视频超分辨率框架DLoRAL,基于扩散模型实现一步生成高清视频。该框架采用双LoRA架构:C-LoRA保持帧间一致性,D-LoRA增强空间细节;通过双阶段训练策略优化时间连贯性和高频信息。相比传统方法,DLoRAL在保持流畅性的同时提升10倍推理速度,显著改善画质细节,为视频高清化提供高效开源解决方案。