Best 声音创作 AI Tools & Models - Premium 声音创作 News

AI News

《第九区》导演震撼发布首部AI短片字节Seedance 2.0 助力科幻巨制

《第九区》导演尼尔·布洛姆坎普发布首部AI微电影《阴兵》，片长13分钟，完全由字节跳动Seedance 2.0生成。他仅通过文本提示词逐帧引导创作，影片获32位真人演员外貌与声音授权，并有专业概念设计师辅助。

14k 11 hours ago

字节跳动发布Seed Audio 1.0：音频生成从“会说”迈向“会创作”

字节跳动发布音频创作模型Seed Audio1.0，已在火山方舟开放测试。它打破传统影视音频需多模型分别生成人声、音效与环境声再人工拼接的冗长流程，实现声音场景一体化创作，确保叙事一致性，标志着AI音频生成进入完整声音场景新阶段。

14.9k 15 hours ago

Google Vids引入Gemini Omni模型上传自拍+音频就能定制专属数字分身

谷歌在Sora可能退场之际，为Google Vids推出重磅更新：用户仅需上传自拍与语音，即可生成外貌声音高度还原的数字虚拟人，无需真人出镜便可完成视频讲解。同时，该功能与多模态模型Gemini深度整合，强化AI视频创作体验。

12.4k 43 minutes ago

Google Vids引入Gemini Omni模型上传自拍+音频就能定制专属数字分身

ElevenLabs上线漫威之父斯坦·李AI声音，全面开放语音合成与故事朗读功能

ElevenLabs平台引入斯坦·李标志性声音，由专业录音室精心还原其温暖、幽默的嗓音。创作者可通过Iconic Marketplace合成语音，或在ElevenReader中用于朗读文章、脚本，应用于视频、播客等场景。

14k 2 days ago

ElevenLabs上线漫威之父斯坦·李AI声音，全面开放语音合成与故事朗读功能

AI Products

Humii

Humiikey提供创作者授权AI声音的睡前陪伴，可文字交流，多功能体验。

情感陪伴

4.5k

VoidMagic

VoidMagic是AI语音创作平台，可克隆名人声音、定制语音。

语音克隆

9.5k

DunSocial

DunSocial是一款AI社交工具，能记忆品牌声音，秒速创作适配各平台的内容

社交媒体服务

7.9k

AI Voice Changer

在线即时改变声音，可创建多种声线，适用于多场景创作。

语音克隆

11.4k

Models

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

qwen3-tts-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Doubao - Seedream - 4.0

Bytedance

Input tokens/M

Output tokens/M

Context Length

Doubao-SeedEdit-3.0-i2i

Bytedance

Input tokens/M

Output tokens/M

Context Length

Hunyuan-T1-20250822

Tencent

Input tokens/M

Output tokens/M

Context Length

qwen-deep-research

Alibaba

$54

Input tokens/M

$163

Output tokens/M

Context Length

腾讯混元生视频-视频特效

Tencent

Input tokens/M

Output tokens/M

Context Length

腾讯混元生视频

Tencent

Input tokens/M

Output tokens/M

Context Length

GPT-5

Openai

$8.75

Input tokens/M

$70

Output tokens/M

400

Context Length

qwen-flash

Alibaba

$15

Input tokens/M

$15

Output tokens/M

Context Length

Pangu-NLP-N2-32K-5.0.1.1

Huawei

Input tokens/M

Output tokens/M

Context Length

GLM-4.5-Flash

Chatglm

Input tokens/M

Output tokens/M

128

Context Length

GLM-4.5-X

Chatglm

Input tokens/M

$16

Output tokens/M

128

Context Length

GLM-4.5-AirX

Chatglm

Input tokens/M

Output tokens/M

128

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

《第九区》导演震撼发布首部AI短片 字节Seedance 2.0 助力科幻巨制

字节跳动发布Seed Audio 1.0：音频生成从“会说”迈向“会创作”

Google Vids引入Gemini Omni模型 上传自拍+音频就能定制专属数字分身

ElevenLabs上线漫威之父斯坦·李AI声音，全面开放语音合成与故事朗读功能

AI Products

Humii

VoidMagic

DunSocial

AI Voice Changer

Models

Gemini 2.0 Flash

Claude 3 Sonnet

qwen3-vl-plus

wan2.5-i2i-preview

wan2.5-i2v-preview

qwen3-omni-flash-realtime

qwen3-tts-flash

Kimi-K2

Doubao - Seedream - 4.0

Doubao-SeedEdit-3.0-i2i

Hunyuan-T1-20250822

qwen-deep-research

腾讯混元生视频-视频特效

腾讯混元生视频

GPT-5

qwen-flash

Pangu-NLP-N2-32K-5.0.1.1

GLM-4.5-Flash

GLM-4.5-X

GLM-4.5-AirX

《第九区》导演震撼发布首部AI短片字节Seedance 2.0 助力科幻巨制

Google Vids引入Gemini Omni模型上传自拍+音频就能定制专属数字分身