Best 语音转文字 AI Tools & Models - Premium 语音转文字 News

AI News

ChatGPT把语音搬进主界面：边说边看图，转录实时生成，还能一键“后悔”回到旧版

OpenAI将实时语音与视觉功能整合进ChatGPT主界面，用户按住麦克风图标即可边说话边查看地图、图表等视觉内容，文字转录同步显示。更新亮点包括多模态同屏交互（语音提问时实时展示相关图像并自动滚动文字），以及连续对话无中断（语音回复同时更新画面，延迟低于300毫秒），无需跳转页面。

10.2k 4 days ago

OpenAI ChatGPT 升级：语音与文本无缝结合，实现多模态互动

OpenAI将ChatGPT语音模式整合进主界面，用户可直接语音对话并实时查看相关视觉信息，如地图、图片等，同时自动生成文字转录稿，方便回顾。此前该功能需手动切换，现已无缝集成。

10.4k 9 hours ago

通义千问推出全新语音识别模型 Qwen3-ASR-Flash，革新语音转文字技术

通义千问推出最新语音识别模型Qwen3-ASR-Flash，基于Qwen3基座模型，经海量多模态数据和数千万小时ASR数据训练，具备高精度、高鲁棒性。核心特性包括领先的识别准确率和出色的歌声识别能力，在多个中英文及多语种基准测试中表现优异。

15.2k 7 hours ago

通义千问推出全新语音识别模型 Qwen3-ASR-Flash，革新语音转文字技术

谷歌在在英国推出 AI 搜索模式，提升复杂问题解答体验

谷歌在英国推出AI搜索新模式，基于Gemini2.5模型支持复杂提问，可处理多部分问题。新功能采用查询扩展技术，将问题分解为子主题并行搜索，提供更精准回答。支持文字/语音/图像多种交互方式，用户可上传图片或语音提问。AI模式会评估回答可信度，低信度时转为传统搜索结果。该功能旨在提升搜索深度和效率，同时促进网站流量多元化。目前仍在优化中，谷歌鼓励用户反馈使用体验。

10.8k 3 days ago