Best 语音输入 AI Tools & Models - Premium 语音输入 News

AI News

字节 TRAE SOLO 上线高级语音输入，联手 Insta360 推 Mic Air 无线麦克风

字节跳动旗下AI编程平台TRAE在SOLO模式中推出内置语音输入功能，并与影石Insta360联合发布Mic Air TRAE联名无线麦克风套装。该组合使“Vibe Coding”和语音办公更易落地，用户可通过自然语音实现结构化转录、语义修正及语音控制AI命令，推动“动嘴不动手”的高效工作方式在开发者和职场人群中流行，语音输入不再仅限于“念什么写什么”。

11.6k 12 minutes ago

字节 TRAE SOLO 上线高级语音输入，联手 Insta360 推 Mic Air 无线麦克风

小米发布全链路语音大模型 MiMo-V2.5，TTS 可“一句话生成新音色”，ASR 开源支持方言与多语混说

小米发布MiMo-V2.5全链路语音模型系列，包括三款TTS模型和一款开源ASR模型，覆盖语音输入与输出。TTS模型能精准调度情绪、语气和角色身份，让声音可编程、可创作、可复刻，提升人机交互自然度，开启语音智能新纪元。

15.9k 2 hours ago

小米发布全链路语音大模型 MiMo-V2.5，TTS 可“一句话生成新音色”，ASR 开源支持方言与多语混说

谷歌悄然发布 Google AI Edge Eloquent:基于 Gemma4的免费离线 AI 听写神器

谷歌在iOS平台推出实验性语音输入应用“Google AI Edge Eloquent”，主打离线优先和智能润色功能，利用边缘AI技术将口语实时转化为专业文本。此举标志着谷歌进入高端AI语音转文字市场，与Wispr Flow和SuperWhisper竞争。应用搭载Gemma4系列技术，强调实时处理和文本优化能力。

11.7k 1 days ago

谷歌悄然发布 Google AI Edge Eloquent:基于 Gemma4的免费离线 AI 听写神器

谷歌正式发布 Gemma4开源大模型:涵盖四种规格，31B 版本位列全球开源榜单第三

谷歌发布开源大模型Gemma4，通过“单位参数智能”提升，为开源模型辅助智能体工作流设定新标准。该系列包含2.3B、4.5B高效版及26B、31B高性能版，基于Gemini3技术栈，全系支持多模态输入，部分版本原生支持语音输入，实现端侧实时语音理解。

谷歌正式发布 Gemma4开源大模型:涵盖四种规格，31B 版本位列全球开源榜单第三

AI Products

Mumble AI

Mumble AI

Mac语音优先应用，支持会议记录、语音笔记和听写，本地模式免费

语音转文本

Caption.IM

Caption.IM

实时字幕和语音输入，适用于桌面端各类对话，支持翻译和多语言。

语音转文本

GHOSTYPE

GHOSTYPE

适用于macOS的AI输入工具，提升输入速度，具备多种智能功能。

Emra / Always on Transcription and PTT

Emra / Always on Transcription and PTT

始终在线的语音工具包，支持语音输入、会议总结等功能

语音转文本

Models

qwen3-asr-flash

Alibaba

qwen3-asr-flash

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen-omni-turbo

Alibaba

qwen-omni-turbo

$1.5

Input tokens/M

$1.6

Output tokens/M

32

Context Length

AIBase

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

Business Cooperation Site Map