信息

AI新闻资讯

探索AI前沿，掌握行业发展趋势

AI 商用·开源产品库

精准筛选产品，多维度产品调研

AI 产品排行榜

热门AI产品实力、热度、年/月/日排行

AI产品提交

提交AI产品信息，助力产品推广和用户转化

工具

AI工具导航

一站式AI工具指南，快速找到你需要的工具

信息

模型库

涵盖各类AI模型，满足你的开发与研究需求

大模型排行榜

热门AI大模型性能、热度、年/月/日排行

模型供应商

寻找优质模型提供商，获取可靠模型支持

工具

大模型选型对比

多维度对比大模型，找到最适合你的模型

大模型费用计算器

精准计算大模型使用成本，合理规划预算

大模型竞技场

多模型实时评测，模型输出结果快速比对

信息

MCP服务端

聚集热门MCP服务，快速找到适合你的服务

MCP客户端

轻松接入MCP客户端，调用强大的AI能力

MCP教程与实践

学习MCP使用技巧，从入门到精通

MCP排行榜

热门MCP服务性能排行，帮你找到最佳选择

MCP服务提交

发布你的MCP服务，推广你的MCP服务

工具

MCP实验场

自由测试MCP服务，线上快速体验

MCP服务调试器

快速测试MCP服务，快速上线

工具

GEO品牌监控分析

分析并追踪人工智能模型如何引用您的品牌

GEO排名查询工具

检测品牌在AI平台中的可见度

服务

GEO 大模型推荐优化

通过AI搜索优化服务，让品牌在AI中实现霸屏

工具

模型个人电脑配置检测器

一键检测电脑配置，研判运行模型的兼容性

模型部署服务器配置计算器

根据算力需求，推荐匹配的服务器配置

AI应用指南

Google发布E3TTS：高质量文本到语音模型

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Nov 7, 2023

Google的研究团队发布E3TTS，一款高质量端到端文本到语音模型。E3TTS采用BERT和扩散UNet模型，直接从文本生成音频波形，支持多语言和零样本任务。实验证明其性能接近最先进的神经TTS系统，为语音合成领域带来创新，提高了质量和效率，为AI语音应用带来新机遇。

语音合成 E3TTS 文本到语音

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

ChatGPT界面大升级！OpenAI上线“富文本编辑块”，写邮件、写博客无需再复制到Word

OpenAI为ChatGPT推出“格式化模块”功能，用户可在聊天界面直接使用富文本编辑工具，如加粗、斜体等，无需借助外部编辑器，提升了结构化内容创作的便捷性。

2025年12月26号 14:01

100

对话框变身编辑器:OpenAI 低调上线“格式化模块”，ChatGPT 也能像 Word 一样排版

OpenAI推出“格式化模块”新功能，让ChatGPT生成的内容自动适应专业文档格式，用户无需再复制到第三方编辑器调整，提升长篇邮件或博文的撰写效率。

2025年12月26号 11:33

400

1美元跑200个浏览器任务！开源浏览器操控神器BU-30B-A3B-Preview横空出世

近日，开源项目BrowserUse发布自研大语言模型BU-30B-A3B-Preview，被誉为网页代理领域新标杆。该模型采用混合专家（MoE）架构，总参数达300亿，但推理时仅激活部分参数，兼顾强大性能与轻量化运行，显著降低了AI浏览器操作的成本与门槛。

2025年12月26号 11:03

430

HodlHer 完成 150 万美元融资，构建 AI 驱动的 Web3 操作系统

HodlHer 完成 150 万美元战略融资，投资方包括 Chain Capital 等。资金将用于发展其核心操作系统 HodlOS，重点提升情感交互、多代理系统及链上代理经济等技术能力，以推动下一代 Web3 操作系统的部署，旨在使智能代理更好地理解用户情感与意图，应对复杂的 Web3 环境。

2025年12月26号 10:07

210

告别对话框!OpenAI 上线“格式化块”，让 ChatGPT 秒变在线编辑器

OpenAI为ChatGPT推出“格式化块”功能，自动调整UI布局以适应邮件、博客等特定任务，提升内容创作体验。新增的“格式框”作为迷你编辑器工具栏，可在富文本区域突出显示文本时提供编辑选项，改变以往单一的聊天气泡展示方式。

2025年12月26号 9:36

300

只需5分钟“速成”:研究发现人类可通过针对性训练识破AI合成人脸

最新研究发现，通过短时间训练可显著提升识别AI合成人脸的能力。实验中，参与者对StyleGAN3生成的假脸进行辨别，未经训练时识别效果有限，但训练后准确率大幅提高。

2025年12月26号 8:54

240

解锁机器人的 3D 视觉：原力灵机推出 GeoVLA 框架，颠覆传统 VLA 模型！

原力灵机团队针对现有视觉-语言-行动模型在复杂环境中因依赖2D图像导致空间感知不足的问题，提出了一种新方案，旨在提升机器人对三维空间深度和位置的判断能力。

2025年12月25号 15:46

260

AI日报：字节发布Seed Prover1.5；MiniMax M2.1开源；通义开源语音交互大模型Fun-Audio-Chat-8B

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、字节跳动发布SeedProver1.5:推动形式化数学推理的新进展字节跳动Seed团队推出的SeedProver1.5在形式化数学推理领域取得重要突破，其通过Agentic强化学习显著提升了推理能力和效率。该功能强调隐私保护，并仅对部分用户开放。

2025年12月24号 15:56

160

阿里通义开源语音交互大模型Fun-Audio-Chat-8B！超低延迟，能读懂情绪

阿里巴巴开源Fun-Audio-Chat-8B语音大模型，主打超低延迟与自然交互，性能媲美GPT-4o Audio等闭源模型。它具备实时理解和情感感知能力，旨在成为真正的AI语音伙伴。

2025年12月24号 14:47

510

MiniMax M2.1震撼开源！100亿激活参数编码模型登顶SOTA，多语言编程全面超越Gemini3Pro与Claude 4.5

国产大模型MiniMax开源M2.1，以100亿参数稀疏架构在多语言编程、代码生成与工具调用上实现突破，在权威基准测试中超越谷歌、Anthropic等闭源旗舰模型，标志着开源编码模型性能进入新阶段。

2025年12月24号 10:35

680

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

模型库

大模型排行榜

模型供应商

大模型选型对比

大模型费用计算器

大模型竞技场

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

GEO品牌监控分析

GEO排名查询工具

GEO 大模型推荐优化

模型个人电脑配置检测器

模型部署服务器配置计算器

Google发布E3TTS：高质量文本到语音模型

站长之家

本文来自AIbase日报

相关AI新闻推荐

ChatGPT界面大升级！OpenAI上线“富文本编辑块”，写邮件、写博客无需再复制到Word

对话框变身编辑器:OpenAI 低调上线“格式化模块”，ChatGPT 也能像 Word 一样排版

1美元跑200个浏览器任务！开源浏览器操控神器BU-30B-A3B-Preview横空出世

​HodlHer 完成 150 万美元融资，构建 AI 驱动的 Web3 操作系统

告别对话框!OpenAI 上线“格式化块”，让 ChatGPT 秒变在线编辑器

只需5分钟“速成”:研究发现人类可通过针对性训练识破AI合成人脸

解锁机器人的 3D 视觉：原力灵机推出 GeoVLA 框架，颠覆传统 VLA 模型！

AI日报：字节发布Seed Prover1.5；MiniMax M2.1开源；通义开源语音交互大模型Fun-Audio-Chat-8B

阿里通义开源语音交互大模型Fun-Audio-Chat-8B！超低延迟，能读懂情绪

MiniMax M2.1震撼开源！100亿激活参数编码模型登顶SOTA，多语言编程全面超越Gemini3Pro与Claude 4.5

相关AI新闻推荐

ChatGPT界面大升级！OpenAI上线“富文本编辑块”，写邮件、写博客无需再复制到Word

对话框变身编辑器:OpenAI 低调上线“格式化模块”，ChatGPT 也能像 Word 一样排版

1美元跑200个浏览器任务！开源浏览器操控神器BU-30B-A3B-Preview横空出世

​HodlHer 完成 150 万美元融资，构建 AI 驱动的 Web3 操作系统

告别对话框!OpenAI 上线“格式化块”，让 ChatGPT 秒变在线编辑器

只需5分钟“速成”:研究发现人类可通过针对性训练识破AI合成人脸

解锁机器人的 3D 视觉：原力灵机推出 GeoVLA 框架，颠覆传统 VLA 模型！

AI日报：字节发布Seed Prover1.5；MiniMax M2.1开源；通义开源语音交互大模型Fun-Audio-Chat-8B

阿里通义开源语音交互大模型Fun-Audio-Chat-8B！超低延迟，能读懂情绪

MiniMax M2.1震撼开源！100亿激活参数编码模型登顶SOTA，多语言编程全面超越Gemini3Pro与Claude 4.5

HodlHer 完成 150 万美元融资，构建 AI 驱动的 Web3 操作系统

HodlHer 完成 150 万美元融资，构建 AI 驱动的 Web3 操作系统