最好的语音输入 AI工具模型_精选语音输入资讯 - AIBase

AI资讯

字节 TRAE SOLO 上线高级语音输入，联手 Insta360 推 Mic Air 无线麦克风

字节跳动旗下AI编程平台TRAE在SOLO模式中推出内置语音输入功能，并与影石Insta360联合发布Mic Air TRAE联名无线麦克风套装。该组合使“Vibe Coding”和语音办公更易落地，用户可通过自然语音实现结构化转录、语义修正及语音控制AI命令，推动“动嘴不动手”的高效工作方式在开发者和职场人群中流行，语音输入不再仅限于“念什么写什么”。

11.9k 3 小时前

字节 TRAE SOLO 上线高级语音输入，联手 Insta360 推 Mic Air 无线麦克风

小米发布全链路语音大模型 MiMo-V2.5，TTS 可“一句话生成新音色”，ASR 开源支持方言与多语混说

小米发布MiMo-V2.5全链路语音模型系列，包括三款TTS模型和一款开源ASR模型，覆盖语音输入与输出。TTS模型能精准调度情绪、语气和角色身份，让声音可编程、可创作、可复刻，提升人机交互自然度，开启语音智能新纪元。

16k 5 小时前

小米发布全链路语音大模型 MiMo-V2.5，TTS 可“一句话生成新音色”，ASR 开源支持方言与多语混说

谷歌悄然发布 Google AI Edge Eloquent:基于 Gemma4的免费离线 AI 听写神器

谷歌在iOS平台推出实验性语音输入应用“Google AI Edge Eloquent”，主打离线优先和智能润色功能，利用边缘AI技术将口语实时转化为专业文本。此举标志着谷歌进入高端AI语音转文字市场，与Wispr Flow和SuperWhisper竞争。应用搭载Gemma4系列技术，强调实时处理和文本优化能力。

12.8k 4 小时前

谷歌悄然发布 Google AI Edge Eloquent:基于 Gemma4的免费离线 AI 听写神器

谷歌正式发布 Gemma4开源大模型:涵盖四种规格，31B 版本位列全球开源榜单第三

谷歌发布开源大模型Gemma4，通过“单位参数智能”提升，为开源模型辅助智能体工作流设定新标准。该系列包含2.3B、4.5B高效版及26B、31B高性能版，基于Gemini3技术栈，全系支持多模态输入，部分版本原生支持语音输入，实现端侧实时语音理解。

谷歌正式发布 Gemma4开源大模型:涵盖四种规格，31B 版本位列全球开源榜单第三

AI产品

Mumble AI

Mumble AI

Mac语音优先应用，支持会议记录、语音笔记和听写，本地模式免费

语音转文本

Caption.IM

Caption.IM

实时字幕和语音输入，适用于桌面端各类对话，支持翻译和多语言。

语音转文本

GHOSTYPE

GHOSTYPE

适用于macOS的AI输入工具，提升输入速度，具备多种智能功能。

Emra / Always on Transcription and PTT

Emra / Always on Transcription and PTT

始终在线的语音工具包，支持语音输入、会议总结等功能

语音转文本

模型

qwen3-asr-flash

Alibaba

qwen3-asr-flash

-

输入tokens/百万

-

输出tokens/百万

-

上下文长度

qwen-omni-turbo

Alibaba

qwen-omni-turbo

$1.5

输入tokens/百万

$1.6

输出tokens/百万

32

上下文长度

AIBase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

商务合作网站地图