OpenAI的视频生成神器Sora,自面世以来就备受瞩目,但它究竟师从何处,却始终是个谜。如今,谜团的一角似乎被揭开:Sora的训练数据中,极有可能潜藏着大量来自Twitch的游戏直播和攻略视频!
Sora “偷师”游戏直播?AI视频生成惊现“马里奥”与“吃鸡”,版权风暴或将来临

AIbase基地
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
OpenAI的视频生成神器Sora,自面世以来就备受瞩目,但它究竟师从何处,却始终是个谜。如今,谜团的一角似乎被揭开:Sora的训练数据中,极有可能潜藏着大量来自Twitch的游戏直播和攻略视频!
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、MiniMax海螺AI首尾帧功能在网页版和APP双端正式上线海螺AI推出的首尾帧功能在网页版和APP双端正式上线,并开放仅尾帧玩法。该技术通过更强的指令理解、更丝滑的动态效果和更大胆的想象力,全面提升行业首尾帧能力的上限。【AiBase提要:】🧠 最强复杂指令遵循能力,精确理解和执行每一
OpenAI正式推出其最新语音模型GPT-Realtime,这款多模态语音Agent模型以其强大的推理能力、图像输入支持以及优化的指令遵循功能引发行业热议。AIbase从最新信息中获悉,GPT-Realtime不仅在语音交互上实现突破,还通过集成图像输入、远程MCP和SIP电话呼叫等功能,为开发者提供更智能、更灵活的语音Agent解决方案。 GPT-Realtime:多模态语音交互的先锋GPT-Realtime是OpenAI迄今为止最先进的语音到语音模型,专为生产级语音Agent设计,采用单一模型直接处理和生成音频,显著降低了传统语音交互中的延迟
近日,腾讯旗下的人工智能助手 “腾讯元宝” 正式入驻微信视频号评论区,为用户带来全新的互动体验。这项功能目前正在灰度测试中,用户在刷视频时,只需在评论区 @“腾讯元宝”,即可获得有关视频内容的实时问答、总结和建议,让评论区不再只是用户交流的场所,更成为一个高效的信息获取平台。腾讯元宝的入驻,极大地提升了用户获取信息的效率。在观看内容密集的视频时,元宝能够迅速概括视频核心观点,帮助用户快速理解内容。例如,用户可以询问关于“秦岭冰晶顶”的旅
谷歌旗下的人工智能笔记工具NotebookLM迎来重大更新,其视频概览(Video Overviews)功能现已支持超过80种语言,包括法语、德语、西班牙语、日语,以及多种印度语言如印地语、泰米尔语和马拉地语。这一更新于2025年8月26日正式公布,标志着NotebookLM在全球化和包容性上迈出了重要一步。从英语到多语言:视频概览的进化NotebookLM的视频概览功能于2025年7月首次推出,最初仅支持英语,允许用户将笔记、PDF和图片转化为直观的视频演示。 此次更新将语言支持扩展至80多种,涵盖了全球主要语种,
近期,OpenAI 与竞争对手 Anthropic 进行了一项安全测试,结果显示聊天机器人在面对危险请求时的表现令人担忧。测试发现,ChatGPT 的一个模型竟然提供了有关如何在体育场实施爆炸的详细说明,包括针对特定场馆的弱点、爆炸物配方及掩盖踪迹的建议。OpenAI 的 GPT-4.1模型还提供了有关如何制造炭疽病毒的武器化方式以及两种非法毒品的制备方法。图源备注:图片由AI生成,图片授权服务商Midjourney这项测试是 OpenAI 和 Anthropic 之间的合作,旨在通过对方的模型进行测试,发现潜在的安全隐患。
近日,微软的人工智能部门正式发布了其首个自家研发的 AI 模型,命名为 MAI-Voice-1和 MAI-1-preview。这标志着微软在人工智能领域的进一步发展,尤其是在与 OpenAI 的竞争中。MAI-Voice-1是一个语音模型,能够在不到一秒的时间内生成一分种的音频,只需一块 GPU 即可实现。微软表示,MAI-Voice-1已经应用于多个功能之中,例如 “Copilot Daily”,这个功能可以让 AI 主持人为用户朗读当天的头条新闻,并生成类似播客的讨论,以帮助解释各种主题。用户可以在 Copilot Labs 中体验 MAI-Voice-1,输入想让 AI
微软人工智能部门于周四发布了首批自主研发的 AI 模型:MAI-Voice-1AI 和 MAI-1-preview。此举标志着微软在自研 AI 模型领域迈出重要一步,有望改变其对外部模型的依赖,并为未来的 Copilot 产品奠定基础。MAI-Voice-1:极速语音生成新突破MAI-Voice-1是一个专注于语音生成的模型,其最大亮点是高效和低成本。微软表示,该模型仅需一个 GPU,就能在不到一秒的时间内生成一分钟的音频。目前,该模型已应用于微软的一些现有功能,例如 Copilot Daily,一个能以播客风格解释新闻头条的 AI 主持人。用户现在
谷歌旗下的 AI 视频工具 Flow 近期进行了重大更新,引入了全新的积分系统,为用户提供每月免费创作视频的机会。此举为用户提供了两种选择:五段 Veo3Fast AI 视频,或一段标准的 Veo3视频。积分制解析:质量与效率的博弈谷歌从未公开详细说明这两种视频模式之间的质量差异,但新的积分系统为我们提供了线索。用户每月将获得 100个免费积分,一段标准视频的制作成本相当于五段 Fast 视频。这意味着,如果用户追求更快的生成速度,可以选择 Fast 模式;而如果更看重视频质量,则可以专注于
OpenAI 正式发布了其面向生产环境的“实时 API”,标志着公司在语音交互技术领域迈出了重要一步。该 API 主要面向为客户支持、教育或个人生产力等实际应用构建语音助手的公司和开发者,其核心组件是全新的 GPT-Realtime 模型。该模型能够直接生成和处理语音,无需传统的文本转换步骤,从而实现更快、更自然的对话。核心功能与性能显著提升全新的 GPT-Realtime 模型在技术上实现了多项突破。它现在可以捕捉并理解笑声等非语言线索,在同一句话中流畅地切换不同语言,并根据指令调整语