北大团队与兔展联合发起了复现 Sora 的 Open Sora 计划,由袁粒和田永鸿领衔,得到 AnimateDiff 的响应。团队已公布框架和实现细节,目前成员共有 13 人。计划已初步实现三项功能,训练仍在进行。
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
北大团队与兔展联合发起了复现 Sora 的 Open Sora 计划,由袁粒和田永鸿领衔,得到 AnimateDiff 的响应。团队已公布框架和实现细节,目前成员共有 13 人。计划已初步实现三项功能,训练仍在进行。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
OpenAI宣布将推出首部AI动画电影《Critterz》,计划2026年全球上映并瞄准戛纳电影节首映。影片讲述森林生物村庄因神秘外来者打破宁静的故事。该项目源于三年前创意顾问查德・尼尔森使用DALL-E 2创作的概念艺术,现由其领导制作。
清华大学等机构联合发布UltraRAG2.0,这是首个基于MCP架构的RAG框架,旨在简化系统构建流程。通过编写YAML文件即可声明复杂逻辑(如串行、循环和条件分支),显著降低开发难度,帮助科研人员快速实现多阶段推理系统。
阿里巴巴云即将发布升级版视频生成AI模型Wan2.2,在Wan2.1基础上实现多项突破:1)性能提升,支持1080p/4K高分辨率及长视频生成;2)新增视频到音频功能,强化多模态创作;3)优化硬件需求,6GB显存设备即可运行;4)训练数据扩充至15亿视频+100亿图像;5)继续开源策略,采用Apache2.0许可证。该模型将巩固阿里在AI视频生成领域的领先地位,挑战OpenAI Sora等封闭模型,推动技术民主化。
OpenAI正秘密开发Sora视频生成模型的升级版Sora2,服务器代码中已出现相关引用。此前发布的Sora虽热度下降,但近期被微软整合进Bing Video Creator重获关注。与此同时,谷歌Veo3已向大学生免费开放,普通用户也可通过Google Cloud体验。两大科技巨头在生成式AI视频领域的竞争日趋白热化,Sora2的发布或将重塑行业格局和内容创作方式。
南洋理工大学等机构联合开源"WORLDMEM"长记忆世界模型,突破传统方法限制,通过创新记忆机制存储场景信息,实现虚拟环境中长期一致性。模型采用条件扩散变换器架构,支持动态更新记忆库,确保场景连贯性,并能响应动作指令。该技术显著提升虚拟现实体验,为未来应用提供支持。
3D建模技术迎来重大革新!由北京大学、字节跳动和卡内基梅隆大学联合研发的PartCrafter项目正式亮相,凭借单张RGB图像即可生成高精度、结构化的3D模型,彻底颠覆传统“先分割再重建”的复杂流程。这一技术不仅提升了生成效率,还能推断不可见结构的3D几何,展现了AI在3D生成领域的巨大潜力。AIbase编辑团队整理了最新信息,为您深度解析PartCrafter的创新与影响。PartCrafter:从单张图像到结构化3D模型PartCrafter是一款开创性的结构化3D生成模型,能够从单张RGB图像直接生成包含多个语义部件的
据科技日报消息,美国西北大学医学院研发的全球首个嵌入临床流程的生成式人工智能放射系统正在革命性地改变医学影像诊断。该系统能在毫秒内识别危及生命的病症,为全球放射科医生短缺危机提供了创新解决方案。这套AI系统已在西北大学所属的12家医院全面部署。2024年5个月的实际应用中,系统成功分析了近2.4万份放射科报告,平均提升报告生成效率15.5%,部分医生工作效率甚至提高40%,且准确率保持不变。后续研究更显示,在CT影像分析中效率提升可达惊人的80%。与市面上只能检测
AI 初创公司 Manus 近日宣布推出其全新的 “文生视频” 功能,旨在为用户提供通过简单文本指令生成视频的便捷体验。该功能目前已经面向 Basic、Plus 和 Pro 会员用户开放抢先体验。Manus 在社交媒体平台 X 上表示,用户只需输入文本命令,其智能系统便能在几分钟内将这些指令转换成结构清晰、故事连贯的视频,展示了其在 AI 视频生成领域的强大能力。此项新功能的推出,让人不禁想起 OpenAI 早前发布的 Sora,后者也提供了类似的文本到视频转换服务。Sora 的使用需要通过 ChatGPT 的付费账户
最近,微软宣布推出一款新工具 ——Bing Video Creator。这款工具是基于 OpenAI 的 Sora 技术,让用户能够通过简单的文字提示轻松创建短视频。与两年前发布的必应图像创建器相似,Bing Video Creator 将 AI 视频生成的功能带给了普通用户。尽管 OpenAI 的 Sora 技术在去年的发布中引起了广泛关注,但由于其对 AI 基础设施的高需求,Sora 目前仅限于每月200美元的 ChatGPT Pro 订阅用户。而这次微软推出的 Bing Video Creator 则完全免费,面向所有必应用户开放,进一步降低了视频创作的门槛。Bing Video Creator 已
最近,通义实验室和北京大学的研究团队推出了一项名为 ZeroSearch 的创新框架,这一新技术可以在不需要真实搜索的情况下,激活大语言模型的检索能力,并且训练成本降低了惊人的88%。这一突破为大语言模型的训练和应用提供了全新的思路。传统的训练方法通常依赖于真实的搜索引擎来获取信息,这不仅造成了高昂的 API 调用成本,还可能因搜索结果的质量不稳定而影响模型的表现。ZeroSearch 巧妙地通过引入大语言模型作为 “模拟搜索引擎”,利用其在预训练过程中积累的丰富知识来生