Best 音声生成 AI Tools & Models - Premium 音声生成 News

AI News

告别僵硬AI视频!快手Kling2.6让你的声音"活"在AI角色里，复杂舞蹈动作也能完美复刻

快手Kling 2.6版本推出语音与动作控制两大功能，实现原生音频生成并提升复杂动作处理精度。语音控制可生成匹配视频的音效、人声和音乐，支持个性化声音定制。

豆包上线 Seedance 1.5 Pro，可直接生成有声视频

字节跳动推出“Seedance1.5Pro”音视频创作模型，现已上线豆包平台。该模型实现“文字-画面-声音”一体化生成，能深度理解文本意图，同步创作匹配的画面、音效与人物台词，有效避免音画脱节，并提升人物“开口说话”的自然度，让普通用户也能轻松制作有声视频。

18.1k 21 minutes ago

阿里万相2.6发布:支持“角色扮演”与多分镜控制，单次视频时长达15秒

阿里巴巴12月16日发布新一代万相2.6系列模型，针对影视制作和图像创作全面升级，号称“全球功能最全的视频生成模型”。该模型已上线阿里云百炼和官网，核心亮点包括国内首个“角色扮演”功能，并支持音画同步、多镜头生成及声音驱动等，在画质、音效等方面实现技术突破。

13.7k 2 hours ago

ElevenLabs炸裂级更新：图像、视频、音乐一站式生成

多模态AI公司ElevenLabs推出集成式内容创作平台，融合图像生成、视频制作、声音合成、音乐创作和音效设计功能，实现从剧本到成品视频的一站式闭环生产，帮助创作者和营销人员告别多平台切换，高效完成商业视频制作。

11.7k 3 hours ago

AI Products

AI Sora 2 Video

Sora 2是AI视频与音频生成平台，可依文本生成带声音的逼真视频

视频生成

4.9k

Meloflow AI

通过先进的AI生成专业音乐，轻松创作版权免费的节拍、旋律和声音，适合创作者和音乐人。

音乐生成

7.2k

WonderShare ToMoviee AI

ToMoviee AI是一款全能AI创意工作室，可以快速生成视频、图像、音乐和声音，适用于创作者、营销人员、电影制作人、设计师和团队。

视频生成

5.4k

Sketch2Sound

通过时间变化信号和声音模仿生成可控音频的模型

音频生成

10k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

告别僵硬AI视频!快手Kling2.6让你的声音"活"在AI角色里，复杂舞蹈动作也能完美复刻

豆包上线 Seedance 1.5 Pro，可直接生成有声视频

阿里万相2.6发布:支持“角色扮演”与多分镜控制，单次视频时长达15秒

ElevenLabs炸裂级更新：图像、视频、音乐一站式生成

AI Products

AI Sora 2 Video

Meloflow AI

WonderShare ToMoviee AI

Sketch2Sound

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

Qianfan-Lightning

wan2.5-i2i-preview

qwen3-max

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

Ming UniAudio 16B A3B

ACE Step V1 Chinese Rap LoRA

EpXTTS

Bigvgan_melspec

XTTS V2

XTTS V2 Argentinian Spanish

Bigvgan_base_24khz_100band

Bigvgan_base_22khz_80band

Bigvgan_24khz_100band

Bigvgan_v2_44khz_128band_512x

Bigvgan_v2_22khz_80band_256x

XTTS V2 Argentinian Spanish

Vocos Mel Hifigan Compat 44100khz

Audio Magnet Small

Magnet Medium 30secs

Magnet Small 30secs

Magnet Medium 10secs

Magnet Small 10secs

XTTS V2

XTTS V1