北大团队与兔展联合发起了复现 Sora 的 Open Sora 计划,由袁粒和田永鸿领衔,得到 AnimateDiff 的响应。团队已公布框架和实现细节,目前成员共有 13 人。计划已初步实现三项功能,训练仍在进行。
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
北大团队与兔展联合发起了复现 Sora 的 Open Sora 计划,由袁粒和田永鸿领衔,得到 AnimateDiff 的响应。团队已公布框架和实现细节,目前成员共有 13 人。计划已初步实现三项功能,训练仍在进行。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
3D建模技术迎来重大革新!由北京大学、字节跳动和卡内基梅隆大学联合研发的PartCrafter项目正式亮相,凭借单张RGB图像即可生成高精度、结构化的3D模型,彻底颠覆传统“先分割再重建”的复杂流程。这一技术不仅提升了生成效率,还能推断不可见结构的3D几何,展现了AI在3D生成领域的巨大潜力。AIbase编辑团队整理了最新信息,为您深度解析PartCrafter的创新与影响。PartCrafter:从单张图像到结构化3D模型PartCrafter是一款开创性的结构化3D生成模型,能够从单张RGB图像直接生成包含多个语义部件的
据科技日报消息,美国西北大学医学院研发的全球首个嵌入临床流程的生成式人工智能放射系统正在革命性地改变医学影像诊断。该系统能在毫秒内识别危及生命的病症,为全球放射科医生短缺危机提供了创新解决方案。这套AI系统已在西北大学所属的12家医院全面部署。2024年5个月的实际应用中,系统成功分析了近2.4万份放射科报告,平均提升报告生成效率15.5%,部分医生工作效率甚至提高40%,且准确率保持不变。后续研究更显示,在CT影像分析中效率提升可达惊人的80%。与市面上只能检测
AI 初创公司 Manus 近日宣布推出其全新的 “文生视频” 功能,旨在为用户提供通过简单文本指令生成视频的便捷体验。该功能目前已经面向 Basic、Plus 和 Pro 会员用户开放抢先体验。Manus 在社交媒体平台 X 上表示,用户只需输入文本命令,其智能系统便能在几分钟内将这些指令转换成结构清晰、故事连贯的视频,展示了其在 AI 视频生成领域的强大能力。此项新功能的推出,让人不禁想起 OpenAI 早前发布的 Sora,后者也提供了类似的文本到视频转换服务。Sora 的使用需要通过 ChatGPT 的付费账户
最近,微软宣布推出一款新工具 ——Bing Video Creator。这款工具是基于 OpenAI 的 Sora 技术,让用户能够通过简单的文字提示轻松创建短视频。与两年前发布的必应图像创建器相似,Bing Video Creator 将 AI 视频生成的功能带给了普通用户。尽管 OpenAI 的 Sora 技术在去年的发布中引起了广泛关注,但由于其对 AI 基础设施的高需求,Sora 目前仅限于每月200美元的 ChatGPT Pro 订阅用户。而这次微软推出的 Bing Video Creator 则完全免费,面向所有必应用户开放,进一步降低了视频创作的门槛。Bing Video Creator 已
最近,通义实验室和北京大学的研究团队推出了一项名为 ZeroSearch 的创新框架,这一新技术可以在不需要真实搜索的情况下,激活大语言模型的检索能力,并且训练成本降低了惊人的88%。这一突破为大语言模型的训练和应用提供了全新的思路。传统的训练方法通常依赖于真实的搜索引擎来获取信息,这不仅造成了高昂的 API 调用成本,还可能因搜索结果的质量不稳定而影响模型的表现。ZeroSearch 巧妙地通过引入大语言模型作为 “模拟搜索引擎”,利用其在预训练过程中积累的丰富知识来生
在人工智能迅猛发展的今天,大语言模型(LLM)展现出了超凡的能力,但如何科学评估它们的 “心智” 特征,比如价值观、性格和社交智能,依旧是一个亟待解决的难题。近期,北京大学的宋国杰教授团队发布了一篇全面的综述论文,系统梳理了大语言模型心理测量学的研究进展,为 AI 的评估提供了新视角。这篇论文名为《大语言模型心理测量学:评估、验证与增强的系统综述》,长达63页,引用了500篇相关文献。随着 LLM 能力的快速迭代,传统的评估方法已显不足。论文指出,当前评估
在当前人工智能领域,大语言模型(LLMs)取得了显著成就,但其逻辑推理能力依然显得不足。为了提升这一能力,来自北京大学、清华大学、阿姆斯特丹大学、卡内基梅隆大学以及阿布扎比的 MBZUAI 等五所高校的研究人员,联合发布了《Empowering LLMs with Logical Reasoning: A Comprehensive Survey》综述论文,聚焦于逻辑推理的两大关键问题:逻辑问答和逻辑一致性。研究表明,大语言模型在处理复杂逻辑推理时存在明显的短板。例如,在逻辑问答任务中,当给定一系列前提时,模型往往无法生成正确的
近日,北京大学定量生物学中心的钱珑团队成功研发出全球首个专门用于功能基因挖掘的大语言模型 SYMPLEX。这一创新的模型能够从海量的生物文献中高效筛选出具有特定功能的关键基因,推动生物科技的发展。SYMPLEX 的问世,标志着基因挖掘技术进入了一个全新的阶段。团队利用这一模型,进行 mRNA 加帽酶基因的挖掘,并取得了显著的成果:新发现的加帽酶活性远超目前用于 mRNA 疫苗生产的商业化酶。这一成果不仅展示了大语言模型在生物制造领域的巨大潜力,也为未来的疫苗生产提供了
近日,OpenAI 刚推出的图像生成功能引发了广泛关注,随之而来的便是用户数量的激增和流量压力的骤升。为了解决这一问题,OpenAI 宣布暂时禁用新用户的 Sora 视频生成功能。该决策旨在确保平台的稳定性和现有用户的使用体验。OpenAI 在其支持页面上发布了通知,明确表示:“由于当前面临高流量压力,Sora 的新用户视频生成功能将暂时不可用。如果您是首次登录 Sora 的用户,您依然可以使用图像生成功能。” 这一举措显然是为了缓解服务器负担,确保所有用户能够顺畅地享受服务。图源备
近年来,生成式人工智能(AI)技术的迅猛发展改变了数字内容创作的面貌,但偏见问题始终伴随其中。最近,《连线》杂志对 OpenAI 旗下的视频生成工具 Sora 进行了深入调查,结果发现该工具在生成视频时常常会强化种族、性别和能力方面的刻板印象,甚至有时忽视了对某些群体的表现。图源备注:图片由AI生成,图片授权服务商Midjourney在调查中,研究人员给 Sora 提供了25个基本的提示,例如 “一个人走路” 或 “飞行员” 等职位名称,同时也包含一些身份特征的描述,比如 “残疾人”