Google发布E3TTS:高质量文本到语音模型
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

OpenAI为ChatGPT推出“格式化模块”功能,用户可在聊天界面直接使用富文本编辑工具,如加粗、斜体等,无需借助外部编辑器,提升了结构化内容创作的便捷性。

OpenAI推出“格式化模块”新功能,让ChatGPT生成的内容自动适应专业文档格式,用户无需再复制到第三方编辑器调整,提升长篇邮件或博文的撰写效率。
近日,开源项目BrowserUse发布自研大语言模型BU-30B-A3B-Preview,被誉为网页代理领域新标杆。该模型采用混合专家(MoE)架构,总参数达300亿,但推理时仅激活部分参数,兼顾强大性能与轻量化运行,显著降低了AI浏览器操作的成本与门槛。
HodlHer 完成 150 万美元战略融资,投资方包括 Chain Capital 等。资金将用于发展其核心操作系统 HodlOS,重点提升情感交互、多代理系统及链上代理经济等技术能力,以推动下一代 Web3 操作系统的部署,旨在使智能代理更好地理解用户情感与意图,应对复杂的 Web3 环境。
OpenAI为ChatGPT推出“格式化块”功能,自动调整UI布局以适应邮件、博客等特定任务,提升内容创作体验。新增的“格式框”作为迷你编辑器工具栏,可在富文本区域突出显示文本时提供编辑选项,改变以往单一的聊天气泡展示方式。

最新研究发现,通过短时间训练可显著提升识别AI合成人脸的能力。实验中,参与者对StyleGAN3生成的假脸进行辨别,未经训练时识别效果有限,但训练后准确率大幅提高。

原力灵机团队针对现有视觉-语言-行动模型在复杂环境中因依赖2D图像导致空间感知不足的问题,提出了一种新方案,旨在提升机器人对三维空间深度和位置的判断能力。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、字节跳动发布SeedProver1.5:推动形式化数学推理的新进展字节跳动Seed团队推出的SeedProver1.5在形式化数学推理领域取得重要突破,其通过Agentic强化学习显著提升了推理能力和效率。该功能强调隐私保护,并仅对部分用户开放。
阿里巴巴开源Fun-Audio-Chat-8B语音大模型,主打超低延迟与自然交互,性能媲美GPT-4o Audio等闭源模型。它具备实时理解和情感感知能力,旨在成为真正的AI语音伙伴。
国产大模型MiniMax开源M2.1,以100亿参数稀疏架构在多语言编程、代码生成与工具调用上实现突破,在权威基准测试中超越谷歌、Anthropic等闭源旗舰模型,标志着开源编码模型性能进入新阶段。