国产大模型Skywork发布移动端APP5.0,支持iOS和安卓。新版核心亮点是实现了“多Agent并行协作”功能,用户通过一句话语音笔记即可快速生成结构化要点、行动清单、脑图,并同步启动多个Agent一键制作PPT、社交媒体文案、播客脚本和宣传海报,显著提升了移动端AI生产力体验。
快手可灵AI推出2.6版本,实现“音画同出”功能,可一次性生成画面、语音、音效及环境氛围,提升内容创作效率。
快手旗下可灵AI推出首个“音画同出”模型可灵2.6,能同时生成画面、语音、音效和环境氛围,打通音画世界。该模型提供“文生音画”和“图生音画”两种创作路径,用户可通过一句话或图片快速生成完整视频,提升创作体验。
育碧推出首个可玩生成式AI项目“Teammates”,结合实时语音指令提升FPS游戏体验。玩家在反乌托邦未来扮演抵抗组织成员,潜入敌方基地寻找失踪队友。AI助手Jaspar通过自然语音交互,增强游戏沉浸感与互动性。
AI语音克隆视频生成平台,可利用名人内容制作吸睛视频。
Noiz AI提供自然流畅的语音合成服务,应用场景丰富,生成高效。
RenderFlow AI是领先的图像和视频生成平台,提供强大AI模型。
免费AI语音生成器,支持120+语言,无需注册,适用于视频、播客等。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$6
$24
256
Baidu
128
$8
$240
52
Bytedance
$1.2
$3.6
4
pnnbao-ump
VieNeu-TTS是首个可在个人设备上运行的越南语文本转语音模型,具备即时语音克隆能力。基于NeuTTS Air微调,能够生成自然逼真的越南语语音,在CPU上具备实时性能。
neuphonic
NeuTTS Air是全球首个具有即时语音克隆功能的超逼真设备端文本转语音模型,基于0.5B参数的大语言模型骨干构建,能在本地设备上实现自然语音生成、实时性能和说话人克隆功能。
Mrkomiljon
基于Wav2Vec2微调的音频分类器,能够区分真人语音和AI生成语音。
mcp-hfspace是一个连接Hugging Face Spaces的MCP服务器,支持图像生成、语音处理、视觉模型等多种AI功能,简化了与Claude Desktop的集成。
ListenHub官方MCP服务器,支持AI播客生成、FlowSpeech语音合成等功能,提供多客户端配置方案和多种传输模式。
Minimax MCP Tools是一个集成Minimax AI能力的MCP服务器实现,提供图像生成和文本转语音功能。
Minimax MCP Tools是一个集成Minimax API的MCP服务器实现,提供AI图像生成和文本转语音功能,支持与Windsurf编辑器无缝集成。
一个基于Resemble AI语音生成API的服务器实现,支持通过MCP协议与Claude和Cursor集成,提供文本转语音功能。
一个基于Streamlit的智能聊天机器人,使用GPT-4o自动路由用户请求到不同工具(如聊天、图像生成、数据库查询、语音合成等),支持快速实验AI工具路由功能。
AI-StoryLab是一个基于Next.js的智能故事创作平台,提供故事生成、语音合成、音效添加和绘图提示词生成功能,支持中英文内容创作。
Tavus MCP服务器是一个基于Model Context Protocol的AI视频生成服务接口,提供完整的Tavus API v2功能,包括AI数字人创建、视频生成、对话式AI、唇形同步和语音合成等25个工具。
MCP-hfspace是一个简化连接Hugging Face Spaces的服务器工具,支持图像生成、语音处理、视觉模型等多种AI功能,与Claude Desktop无缝集成。
基于Minimax AI和Amazon S3的语音生成MCP服务器,提供文本转语音功能并自动上传音频文件到云端存储