开源语音转字幕软件 Whisper 可识别多种语种
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

腾讯推出HY-MT1.5系列翻译模型,打破传统依赖云端服务器的限制。该系列包含两个版本:1.8B小尺寸版,仅需约1GB内存即可在手机等设备上流畅运行,翻译50字句子平均响应时间仅0.18秒;7B升级版性能更强,满足不同场景需求。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、微信推出AI小程序成长计划:免费资源与巨额支持助力开发者微信推出全新的「AI应用及线上工具小程序成长计划」,旨在为开发者提供全面支持,帮助他们在2026年实现小程序的快速发展。10、机器人会说话了!智元联合MiniMax,定制“千人千面”专属人设MiniMax与智元机器人达成深度战略合作,提供从文本到语音的全流程AI技术支持,打造定制化交互体系,实现千人千面的个性化音色合成,并引入音乐生成模型拓展多元化场景玩法。
中国电信人工智能研究院开源星辰语义大模型TeleChat3系列,包括千亿参数MoE模型和稠密架构模型。该系列完全基于国产万卡算力池训练,数据规模达15万亿tokens,实现全栈国产化,标志着我国超大规模AI模型自主可控取得关键突破。
智元机器人与MiniMax达成战略合作,MiniMax将为其人形机器人提供端到端文本到语音技术,提升机器人在真实场景中的自然交互与情感表达能力。合作聚焦语音合成,利用高自然度语音生成、多情感语调建模等技术,打造“会说话”的智能体。

三星Family Hub智能冰箱新增语音开关门功能,用户可通过Bixby语音助手控制冰箱门开关,支持超过90度完全打开,方便烹饪时使用。
OpenAI正加速研发音频AI模型,为语音优先智能硬件做准备。近期整合多个团队,集中提升语音交互技术,以改善对话表现和响应能力。目前语音模型在准确性和速度上仍落后于文本模型,因此正加速架构升级,开发新一代音频模型。
九坤投资推出AI大模型IQuest-Coder-V1系列,具备强大代码生成与理解能力。该系列提供7B、14B和40B三种参数版本,其中40B版本在SWE-Bench Verified榜单上表现突出,以81.4%的成绩超越Claude Opus-4.5和GPT-5.2等知名模型,引发科技界关注。
OpenAI正整合团队,加速研发音频AI技术,以提升语音模型的对话表现和响应速度,为即将推出的语音优先智能设备做准备。
清华大学NLP实验室等机构联合开源了音频模型测评框架UltraEval-Audio,为音频大模型提供完整的评测方法。该框架最新版本v1.1.0在原有“一键测评”基础上,新增了热门音频模型的一键复现功能,进一步完善了音频评测体系。
近日有博主称国行iPhone 16 Plus收到“Apple智能与Siri”测试提示,引发苹果国行AI开启灰度测试的讨论。苹果官方回应称,Apple Intelligence目前尚未在中国大陆上线,相关传闻不实。