MyShell多语言、多口音文本转语音库MeloTTS开源
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
班加罗尔语音AI初创公司Arrowhead获300万美元种子轮融资,由Stellaris Venture Partners领投,CRED创始人库纳尔·沙阿等天使投资人跟投。资金将用于优化AI模型、扩充团队,并拓展金融服务市场。
上汽名爵发布2026款MG7,共推四款车型,延续轿跑运动设计,新增冰岛蓝配色。新车采用溜背造型、豹跃肩线及无边框车门,强化动感外观,长宽高尺寸保持现款风格。

谷歌在CES 2026上展示了Gemini在Google TV上的新功能,通过AI提升智能电视体验。用户可用自然语言模糊搜索内容,如“找一部像《权力的游戏》那样的奇幻剧”,系统能精准匹配。此外,电视还具备互动学习、照片编辑和设置优化等功能,标志着智能电视进入更自然、视觉化的AI时代。
智元机器人与MiniMax达成战略合作,MiniMax将为其人形机器人提供端到端文本到语音技术,提升机器人在真实场景中的自然交互与情感表达能力。合作聚焦语音合成,利用高自然度语音生成、多情感语调建模等技术,打造“会说话”的智能体。

三星Family Hub智能冰箱新增语音开关门功能,用户可通过Bixby语音助手控制冰箱门开关,支持超过90度完全打开,方便烹饪时使用。
OpenAI正加速研发音频AI模型,为语音优先智能硬件做准备。近期整合多个团队,集中提升语音交互技术,以改善对话表现和响应能力。目前语音模型在准确性和速度上仍落后于文本模型,因此正加速架构升级,开发新一代音频模型。
OpenAI正整合团队,加速研发音频AI技术,以提升语音模型的对话表现和响应速度,为即将推出的语音优先智能设备做准备。
OpenAI正整合团队重构音频AI系统,计划2026年推出音频优先设备,押注语音交互成为后屏幕时代核心。

Plaud Note Pro凭借信用卡尺寸、离线录音和独立工作能力,在专业场景中异军突起,累计出货超100万台,超50%用户转化为付费订阅,成为AI录音设备领域的“隐形冠军”。
初创公司Resemble AI发布开源语音模型“Chatterbox Turbo”,挑战行业巨头。该模型仅需5秒音频即可克隆语音,延迟低至150毫秒,适用于实时AI代理、客服、游戏角色等场景,性能显著提升。