ElevenLabs平台引入斯坦·李标志性声音,由专业录音室精心还原其温暖、幽默的嗓音。创作者可通过Iconic Marketplace合成语音,或在ElevenReader中用于朗读文章、脚本,应用于视频、播客等场景。
小米发布MiMo-V2.5全链路语音模型系列,包括三款TTS模型和一款开源ASR模型,覆盖语音输入与输出。TTS模型能精准调度情绪、语气和角色身份,让声音可编程、可创作、可复刻,提升人机交互自然度,开启语音智能新纪元。
抖音生活服务发布《AIGC创作规范》,要求创作者使用人工智能或深度合成技术时,须保障消费者知情权,主动声明内容含生成合成成分;使用他人肖像、声音、作品需获合法可追溯授权,并明确禁止违规行为。
抖音生活服务4月22日发布《AIGC创作规范》,核心聚焦权益保护与信息真实性,明确创作者使用人工智能生成内容或深度合成技术的行为边界。规范严禁未经授权利用AIGC技术对他人的肖像、声音或作品进行换脸、仿声及改编,以保障消费者知情权并维护健康内容生态。
VoidMagic是AI语音创作平台,可克隆名人声音、定制语音。
DunSocial是一款AI社交工具,能记忆品牌声音,秒速创作适配各平台的内容
在线即时改变声音,可创建多种声线,适用于多场景创作。
通过先进的AI生成专业音乐,轻松创作版权免费的节拍、旋律和声音,适合创作者和音乐人。
Google
$0.7
Input tokens/M
$2.8
Output tokens/M
1k
Context Length
Anthropic
$21
$105
200
Alibaba
$1
$10
256
-
$3.9
$15.2
64
Moonshot
$4
$16
Bytedance
Tencent
32
$54
$163
Openai
$8.75
$70
400
$15
Huawei
Chatglm
128
$8