Best 语音编辑 AI Tools & Models - Premium 语音编辑 News

AI News

特斯拉节日更新让AI直接接管导航，xAI生态再下一城

特斯拉2025节日更新引入xAI的Grok聊天机器人，深度集成导航功能。用户可通过语音指令添加或编辑多个目的地，系统自动规划路线并在中控屏可视化展示，实现“语音即目的地”的便捷导航体验。

15.2k 12 hours ago

谷歌视频编辑平台Vids新功能全员开放，包括AI语音配音、去除冗余口语、AI 图像编辑等

谷歌视频编辑平台Vids向所有用户免费开放AI功能，包括语音配音、自动去除冗余口语和图像编辑等。用户只需上传视频，系统即可自动识别并精简冗余内容。

12.9k 14 hours ago

谷歌视频编辑平台Vids新功能全员开放，包括AI语音配音、去除冗余口语、AI 图像编辑等

语音编辑像改Word？阶跃星辰发布30亿参数音频编辑模型Step-Audio-EditX

国内AI公司阶跃星辰发布Step-Audio-EditX模型，实现用自然语言指令编辑语音。用户只需输入文字要求，即可精准调整音色、情绪、节奏等，让语音编辑如修改文档般直观高效。30亿参数确保性能强大。

13.4k yesterday

Step-Audio-EditX 发布:30亿参数音频 LLM 打开语音“可编辑时代”

StepFun AI发布开源项目Step-Audio-EditX，基于30亿参数音频语言模型，将语音编辑转化为类似文本标记的可控操作，突破传统波形处理模式。该技术有望实现"像编辑文本一样编辑语音"的直观交互，相关论文已发布于arXiv平台（编号2511.03601）。

15.6k 1 hours ago

AI Products

Fanfun AI

AI语音克隆视频生成平台，可利用名人内容制作吸睛视频。

视频生成

VoiceCraft

零样本语音编辑和文本转语音技术

AI语音合成

18.5k

VLOGGER

文本和语音驱动的人体视频生成，从单张人物输入图像生成视频。

AI视频生成

32.1k

万能影室

语音编辑、智能制图、AI模型提供高效的创作服务

视频编辑

20.6k

Models

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

qwen3-omni-30b-a3b-captioner

Alibaba

$15.8

Input tokens/M

$12.7

Output tokens/M

Context Length

qwen3-tts-flash-realtime

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-tts-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

Doubao-SeedEdit-3.0-i2i

Bytedance

Input tokens/M

Output tokens/M

Context Length

Doubao-1.5-pro-32k

Bytedance

$0.8

Input tokens/M

Output tokens/M

128

Context Length

qwen3-asr-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen-Image

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-tts-realtime

Alibaba

$2.4

Input tokens/M

$12

Output tokens/M

Context Length

Hunyuan-TurboS-latest

Tencent

$0.8

Input tokens/M

Output tokens/M

Context Length

Doubao-1.5-thinking-vision-pro

Bytedance

Input tokens/M

Output tokens/M

128

Context Length

qwen-tts

Alibaba

$1.6

Input tokens/M

$10

Output tokens/M

Context Length

Gemini Diffusion

Google

Input tokens/M

Output tokens/M

Context Length

qwen-omni-turbo

Alibaba

$1.5

Input tokens/M

$1.6

Output tokens/M

Context Length

MCP

Chatty Mcp

Chatty MCP是一款为编辑器设计的语音交互插件，能在完成AI请求后通过语音总结操作内容，提升多任务处理效率，支持自定义语音引擎。

typescript

8.9k

2.5points

Vapi Mcp

该项目实现了一个Vapi语音AI与Cursor编辑器集成的MCP服务器，提供语音呼叫、助手管理等功能。

typescript

10.1k

2.5points

Voicevox Mcp Server

Voicevox MCP Server是一个VOICEVOX兼容的语音合成服务器，通过MCP协议实现与AivisSpeech/VOICEVOX/COEIROINK的交互，支持Cursor等编辑器中的Claude 3.7代理模式语音合成。

typescript

11.6k

2.5points

Minimax AI

Minimax MCP Tools是一个集成Minimax API的MCP服务器实现，提供AI图像生成和文本转语音功能，支持与Windsurf编辑器无缝集成。

javascript

9.3k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

特斯拉节日更新让AI直接接管导航，xAI生态再下一城

谷歌视频编辑平台Vids新功能全员开放，包括AI语音配音、去除冗余口语、AI 图像编辑等

语音编辑像改Word？阶跃星辰发布30亿参数音频编辑模型Step-Audio-EditX

Step-Audio-EditX 发布:30亿参数音频 LLM 打开语音“可编辑时代”

AI Products

Fanfun AI

VoiceCraft

VLOGGER

万能影室

Models

Gemini 2.0 Flash

wan2.5-i2i-preview

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

wan2.5-t2v-preview

wan2.5-t2i-preview

qwen3-omni-flash-realtime

qwen3-omni-30b-a3b-captioner

qwen3-tts-flash-realtime

qwen3-tts-flash

Doubao-SeedEdit-3.0-i2i

Doubao-1.5-pro-32k

qwen3-asr-flash

Qwen-Image

qwen-tts-realtime

Hunyuan-TurboS-latest

Doubao-1.5-thinking-vision-pro

qwen-tts

Gemini Diffusion

qwen-omni-turbo

Ming Flash Omni Preview

Ming UniAudio 16B A3B

MiMo Audio 7B Base

VoiceCraft

MCP

Chatty Mcp

Vapi Mcp

Voicevox Mcp Server

Minimax AI

AI News

特斯拉节日更新让AI直接接管导航，xAI生态再下一城

​谷歌视频编辑平台Vids新功能全员开放，包括AI语音配音、去除冗余口语、AI 图像编辑等

语音编辑像改Word？阶跃星辰发布30亿参数音频编辑模型Step-Audio-EditX

Step-Audio-EditX 发布:30亿参数音频 LLM 打开语音“可编辑时代”

AI Products

Fanfun AI

VoiceCraft

VLOGGER

万能影室

Models

Gemini 2.0 Flash

wan2.5-i2i-preview

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

wan2.5-t2v-preview

wan2.5-t2i-preview

qwen3-omni-flash-realtime

qwen3-omni-30b-a3b-captioner

qwen3-tts-flash-realtime

qwen3-tts-flash

Doubao-SeedEdit-3.0-i2i

Doubao-1.5-pro-32k

qwen3-asr-flash

Qwen-Image

qwen-tts-realtime

Hunyuan-TurboS-latest

Doubao-1.5-thinking-vision-pro

qwen-tts

Gemini Diffusion

qwen-omni-turbo

Ming Flash Omni Preview

Ming UniAudio 16B A3B

MiMo Audio 7B Base

VoiceCraft

MCP

Chatty Mcp

Vapi Mcp

Voicevox Mcp Server

Minimax AI

谷歌视频编辑平台Vids新功能全员开放，包括AI语音配音、去除冗余口语、AI 图像编辑等