腾讯推出AI音频生成工具AudioGenie,具备多模态音频生成能力,采用无训练框架,可一键生成电影级音效,挑战Claude和Gemini等现有产品,重新定义AI音频生成标准。
阿里巴巴推出开源多模态智能体WebWatcher,整合网页浏览、图像搜索、代码解释器等工具,突破现有闭源系统局限。该智能体具备视觉理解、逻辑推理、知识调用等能力,可像人类研究员一样处理复杂多模态任务。