Karpathy推出新项目minbpe,GitHub标星量破1.2k

AI创投
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义万相Wan2.1-VACE开源 号称首个开源的视频编辑统一模型通义万相宣布VACE开源,支持多种分辨率和任务,提供一站式视频创作体验,通过多模态输入机制实现高效灵活的视频编辑。【AiBase提要:】✨ 支持文生视频、图像参考生成、局部编辑与视频扩展等多种任务,提高创作效率。🌟 强大
近日,全球知名的大模型整合应用平台 Poe 发布了2025年春季 AI 模型使用趋势报告。报告显示,在文生视频领域,中国的快手可灵多款视频生成模型迅速崛起,已占据了约30% 的市场份额,领先于 Runway 和谷歌的 Veo2。图源备注:图片由AI生成,图片授权服务商Midjourney特别值得一提的是,可灵2.0模型自今年4月推出以来,仅仅在三周内就取得了21% 的使用比例,展现出其强大的市场吸引力和应用能力。该模型在动态质量、语义响应和画面美学等多个维度上,继续保持全球领先地位。根据数据显示
据techcrunch消息,总部位于北京、曾隶属于微软的人工智能研究团队 WizardLM,近日被爆出已整体加入腾讯 AI 实验室旗下的“混元”团队。多位核心研究人员在社交平台 X(原推特)上宣布了这一动向,预示着腾讯正进一步加强其在大模型领域的攻势。在周二的帖子中,曾领导多个 WizardLM 项目的微软高级研究员 Can Xu 表示,他和团队已经离开微软,并正式加入腾讯混元团队。该团队近年来在视频生成、3D内容创作等多个方向发布了具有突破性的模型。更引人关注的是,WizardLM 近期公开发布了名
近日,华中科技大学宣布,全球首个女性肿瘤人工智能大模型 “木兰” 已正式进入临床应用阶段。这一重要的医疗技术是由华中科技大学同济医学院附属同济医院国家妇产疾病临床医学研究中心与多家机构联合研发,旨在提升女性肿瘤的筛查和治疗水平。“木兰” 模型以近20年的高质量病例数据为基础,结合国内外权威的女性肿瘤医疗指南及专家共识,特别适合中国女性的健康需求。这款 AI 模型解决了我国女性肿瘤诊疗标准化程度低、同质性差的问题,填补了该领域的空白。图源备注:
在最近发布的全球视频生成大模型榜单中,快手旗下的可灵 AI2.0模型以1124分的 Arena ELO 评分一举超越了其前任1.6版本,成功夺得全球冠军。这一消息引发了广泛关注,尤其是在 AI 技术日益崛起的背景下。可灵 AI2.0模型已经连续三个月稳居图生视频领域的顶端,显示出其强大的技术实力和市场潜力。可灵 AI2.0于4月15日在北京正式发布,针对动态质量、语义理解以及画面美学等核心指标进行了全面提升,持续引领行业发展。自从2023年6月上线以来,可灵 AI 的全球用户数已突破2200万,月活跃用
5月14日晚,阿里巴巴正式推出了通义万相 Wan2.1-VACE,这是当前行业中功能最为全面的视频生成与编辑模型。该模型的亮点在于它具备多种强大的能力,可以同时实现文生视频、图像参考视频生成、视频重绘、局部编辑、背景延展和时长延展等多项基础生成和编辑功能。这一开创性的产品标志着视频制作的门槛进一步降低,使更多的创作者能够轻松上手。此次开源的模型分为两个版本,分别为1.3B 和14B,其中1.3B 版本特别设计为能够在消费级显卡上流畅运行,意味着即使是普通用户也能体验到
Step1X-3D模型总参数量达4.8B,其中几何模块1.3B,纹理模块3.5B。凭借坚实的数据基础与先进的3D原生架构,该模型能够生成高保真、可控的3D内容。Step1X-3D不仅追求视觉上的“好看”,更注重“好用”与“可控”,旨在为3D内容创作提供强大而可靠的技术引擎。
在人工智能领域竞争日益激烈的今天,字节跳动的 Seed 团队于5月13日正式发布了其最新的多模态大模型 Seed1.5-VL,旨在为智能体技术的进步铺平道路。该模型经过超过3万亿 tokens 的多模态数据预训练,不仅具备强大的通用多模态理解和推理能力,还显著降低了推理成本。与谷歌近期推出的 Gemini2.5Pro 相比,Seed1.5-VL 在性能上表现不相上下。谷歌的 Gemini2.5Pro 支持图像、视频、音频和代码的统一理解,并在多个基准测试中领先于 GPT-4.0。字节跳动的 Seed 团队表示,尽管 Seed1.5-VL 的激活参数仅为2
近日,昆仑万维正式宣布开源其最新的 Matrix-Game 大模型,这一模型以其超过10亿参数的规模,成为了工业界首个开源的空间智能大模型,标志着交互式世界生成技术的重大突破。Matrix-Game 不仅支持知名游戏《我的世界》,还专为开放式环境中的高质量生成和精确控制而设计。Matrix-Game 大模型的核心在于其三大组成部分。首先是 “Matrix-Game-MC 数据集”,这个数据集通过自主构建,涵盖了大量的 Minecraft 游戏视频,包括无标签的大规模视频以及带有控制信号的可控视频数据,允许开发者高效建
在人工智能和大模型技术飞速发展的今天,如何高效调用外部工具已成为开发者们面临的新挑战。不同大模型的调用结构和参数格式各不相同,导致开发者不得不为每种模型单独编写工具调用逻辑,进而影响了集成的效率。为了解决这一难题,合合信息近日推出了文档处理领域首批 MCP(Model Context Protocol)服务,为企业和开发者提供了一个 “万能接口”。合合信息成立于2006年,是一家专注于人工智能和大数据技术的企业。其旗下的 TextIn 产品,凭借其领先的智能文档处理技术,正在改变这