智元机器人与MiniMax达成战略合作,MiniMax将为其人形机器人提供端到端文本到语音技术,提升机器人在真实场景中的自然交互与情感表达能力。合作聚焦语音合成,利用高自然度语音生成、多情感语调建模等技术,打造“会说话”的智能体。
Luma AI推出Ray3Modify模型,实现高保真AI视频修改,可更换角色、服装、场景并生成过渡镜头,同时完整保留演员动作、眼神和情感表达,解决了传统AI工具难以保持表演一致性的痛点。
研究发现,AI生成的社交媒体帖子容易被人类识别,准确率达70%-80%,远超随机水平。研究团队测试了多个大语言模型,揭示其在内容识别方面的不足。
StepFun AI发布开源音频编辑模型Step-Audio-EditX,该3B参数模型将音频编辑转化为类似文本编辑的令牌操作,实现直接可控的语音编辑。它解决了当前零样本文本转语音系统在情感、风格等控制上的局限,使表达性语音编辑更简单精确。
用AI将宠物照片转化为会说话的视频,轻松表达情感。
基于记忆引导扩散的表达性视频生成工具
通过音乐分享你的情感
音频变声技术,转换声音同时保留原始表达和情感
Alibaba
$1.6
Input tokens/M
$10
Output tokens/M
8
Context Length
Openai
$525
$1050
128
Tencent
$4
$8
28
Baidu
-
4
AnasAlokla
这是一个强大的多语言、多标签情感分类模型,能够分析文本并识别27种不同的情感以及中性类别,支持同时检测多种情感,有效理解来自不同语言来源的细微文本表达。
okezieowen
这是一个16位量化且经过合并的文本转语音模型,基于canopylabs/orpheus-3b-0.1-ft进行微调,使用Unsloth和LoRA优化,专门针对非洲低资源语言进行优化,支持多语言语音合成和情感表达。
webbigdata
VoiceCore是一款可商用的日语语音AI代理模型,专注于让AI通过语音与人类进行自然交流,具备情感表达和非语言声音能力,支持多种语音风格选择。
tsak6666
这是一个基于SST-2数据集微调的预训练DistilBERT模型,用于情感分析。它可以预测给定文本表达的是积极还是消极情感。
Karayakar
Orpheus是一个支持土耳其语的文本转语音(TTS)模型,基于canopylabs/orpheus-3b-0.1-pretrained训练,支持多种情感表达。
SebastianBodza
基于Orpheus-3B的德语文本转语音(TTS)模型,支持多说话者和情感表达。
ai4bharat
基于VITS架构的文本转语音模型,支持13种印度语言,具有多样化说话风格与情感表达
HelpingAI
HelpingAI-TTS-v1是一款专注于个性化、情感表达和清晰度的新一代文本转语音(TTS)工具,支持多种语言和情感定制。
Borcherding
基于《星球大战》C-3PO角色语音微调的多语言文本转语音模型,具有讽刺风格和情感表达能力
DavidAU
基于TeeZee/DarkSapling-7B-v1.1全面重制的32k上下文大语言模型,在指令遵循、推理深度和情感表达方面表现优异
akoyaki
一个专为角色扮演优化的合并模型,具有高度敏感性和智能表现,特别擅长捕捉细微设定和情感表达。
ntc-ai
这是一个基于Stable Diffusion XL的微调模型,专门用于生成表达'极度恐惧'情感的图像。
这是一个基于Stable Diffusion XL (SDXL)微调的文生图模型,专门用于生成表达'喜悦'情感的图像。
Guizmus
一个基于Stable Diffusion 1.5的文本生成图像模型,专为Discord上的'每周图片'比赛设计,旨在通过艺术表达情感和故事。
puzzz21
该模型基于Scibert专门针对科学文本中的情感分类进行了微调,能够根据句子上下文对作者表达的情感进行分类。