单件3分钱,那些喂养大模型的人

市界
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,清华大学叉院的 ISRLab 与北京星动纪元科技有限公司携手推出了首个 AIGC(人工智能生成内容)机器人大模型 ——VPP(视频预测策略)。这一创新成果在2025年国际机器学习大会(ICML2025)上荣获 Spotlight 论文奖,显示出其在全球 AI 研究领域的前沿地位。AIGC 技术近年来迅速崛起,从生成式文本模型到视频生成技术,其应用范围不断扩大。而 VPP 的诞生标志着这一技术的应用迈向了具身智能机器人领域。VPP 的独特之处在于其利用了海量互联网视频数据进行训练,使得机器人能够在接收到简单
腾讯元宝宣布其文生图功能全面升级,支持混元和DeepSeek两大模型生成图片。这一升级使得用户只需通过简单的一句话描述,即可生成高质量、复杂且富有想象力的图像。
近日,星动纪元宣布,已与清华大学叉院的 ISRLab 合作,开源了首个 AIGC(生成式人工智能内容)机器人大模型 ——VPP(视频预测策略)。这一创新成果有望在机器人领域带来革命性的进展。VPP 模型通过将视频扩散模型的泛化能力引入到通用机器人操作策略中,解决了以往机器人推理速度慢的问题。VPP 能够实时预测未来动作,从而极大提升机器人的策略泛化能力。值得注意的是,这一模型已在国际机器学习大会(ICML2025)上获得 Spotlight 认可,展现出其研究的前沿性和重要性。实时预测与高效
阶跃星辰与ACE Studio联合发布了开源音乐大模型ACE-Step(中文名:音跃),标志着音乐创作与生成技术的又一重要突破。ACE-Step是继语音、视频、图片、视觉推理等多模态大模型之后的又一成果,展现了音乐创作与生成的最新进展。
在近期举办的 Asembia AXS25峰会上,行业专家们探讨了人工智能(AI)在药房运营中的潜力,尤其是在处方药履行的各个环节。Harry Travis,The Travis Group 的总裁,在接受《药房时报》采访时,分享了他关于 “AI 对医疗和药房的影响” 的演讲。他强调,要充分发挥 AI 的优势,药房行业必须解决监管和医保支付方面的挑战。Travis 指出,AI 可以在处方履行的每个步骤中发挥作用,尤其是在处理药物相互作用、优先授权问题以及帮助患者支付药物费用方面。他解释说,AI 可以通过分析海量临床数据,
思科(Cisco)与 Meta 的合作为我们带来了一个令人振奋的新进展。他们共同发布了名为 Foundation-sec-8B 的开源大型语言模型(LLM),该模型专门针对网络安全领域,具有80亿个参数。这一创新产品不仅展现了两大科技巨头的强强联手,也预示着网络安全技术的新纪元。Foundation-sec-8B 模型基于 Meta 最新的 Llama3.1架构,由思科新成立的研发团队开发。团队在训练过程中,利用了精选的网络安全数据集,使得该模型在应对各种网络威胁时表现尤为出色。这些威胁包括但不限于网络攻击、数据泄露和恶意
在科技领域的众多领袖中,IBM 首席执行官阿尔温德・克里希纳(Arvind Krishna)表示,联邦对人工智能及相关技术的研发资金应该增加,而不是削减。在接受 采访时,克里希纳明确指出:“我们公司以及我个人都强烈主张,联邦资助的研发应该增加。这是毫无疑问的立场,我们坚信这一点。”特朗普总统及其内阁近期寻求大幅削减联邦拨款和科学研究项目,推动与以往政府不同的优先事项。最近,一个负责人工智能研究的关键联邦机构 —— 技术、创新与合作处(TIP)面临严峻的预算削减。同
理想汽车创始人兼 CEO 李想在社交平台上宣布,《AI Talk 第二季》将于5月7日晚上8点正式上线。在这一季中,他将与观众分享自己对人工智能最新的思考,尤其是理想 VLA 司机大模型的创新理念。李想表示,VLA 司机大模型不仅是技术的结晶,更是生物进化的延续,从动物智能到人类智慧的跃迁。在即将到来的节目中,李想将重点解答以下三个引人关注的问题:首先,他将探讨为什么理想 VLA 司机大模型被视为从动物到人类的进化过程。他指出,汽车行业正在经历一场前所未有的智能革命,VLA
在最近的一次采访中,IBM 首席执行官阿尔温德・克里希纳(Arvind Krishna)表示,随着人工智能(AI)市场竞争的加剧,IBM 正计划通过提供能够整合客户使用的不同 AI 代理的工具,来提升其在该领域的销售。这些工具将帮助客户管理他们在关键业务应用中的一系列 AI 代理,主要包括 Salesforce、Workday 和 Adobe 等公司的产品。克里希纳指出,IBM 将助力客户构建适合未开发用例的 AI 代理,客户只需在五分钟内完成创建。IBM 的这些工具将基于 IBM Granite 系列的 AI 模型,并结合来自 Meta 平台和 Mistral 等
最近 AI 圈可是热闹非凡,今天咱们就来聊聊其中的 “狠角色”——LLaMA-Omni2。这是一系列超厉害的语音语言模型(SpeechLMs),参数规模从0.5B 到14B 不等,专门为实现高质量实时语音交互而生,在 Hugging Face 上一经发布,就引起了广泛关注。语音交互发展历程回顾:从 “卡顿” 到 “丝滑”语音交互在人机交互领域的地位愈发重要,它就像是为我们打开了一扇便捷的大门,极大地提升了交互效率和用户体验。大家想想,以前操作设备只能靠手动输入,现在只需动动嘴就能搞定,多方便!随着像