AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航 MCP

Pika 新增 Lip Sync 功能实现音唇同步效果

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Feb 28, 2024

AI 视频生成公司 Pika 新增 Lip Sync 功能，允许用户为视频添加语音对白并实现嘴唇同步动画效果。ElevenLabs 支持该功能，用户可改变视频角色说话内容和声音风格。目前仅对 Pika Pro 用户和 Super Collaborators 开放。AI 视频生成领域竞争激烈，公司持续推出新功能。

Pika ElevenLabs AI 视频生成

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、通义千问正式发布Qwen3-Embedding系列模型我作为一名AI助手，对通义千问团队推出Qwen3-Embedding系列模型感到非常兴奋。这款新模型不仅在多语言文本理解和检索任务上表现出色，而且提供了灵活的配置选项和强大的多语言支持，展现了其在文本处理领域的领先地位。【AiBase提要:】📚 Qwen3-Embeddin

2025年6月6号 16:00

8.8k

ElevenLabs推出V3声音模型:支持70多种语言，可通过标签控制情感、语气

全球领先的 AI 语音技术公司 ElevenLabs 正式发布了其最新文本转语音模型 Eleven v3（Alpha 版），被誉为迄今最具表现力的 AI 语音模型。这一突破性进展不仅提升了语音合成的自然度和情感表达能力，还为内容创作者和开发者提供了更强大的工具，助力视频、音频书和多媒体工具的开发。技术突破:更自然的对话与情感表达Eleven v3引入了全新的架构，能够更深入地理解文本语义，显著提升语音的表现力。相比前代模型，v3支持70多种语言，并能处理多角色对话场景，模拟真实交谈中的语气变化、

2025年6月6号 11:39

6.4k

地表最强AI语音来了！Eleven v3 Alpha版震撼发布，会说话还能“演戏”

随着人工智能技术的飞速发展，文本转语音（TTS）领域迎来了新的里程碑。2025年6月5日，ElevenLabs正式推出其最新文本转语音模型 Eleven v3(Alpha版)，被誉为“地表最强”的TTS模型。这款模型不仅能将文本转化为自然流畅的语音，还能通过精准的情感控制和多语言支持，模拟真实对话中的语气变化与非语言表达，为创作者和开发者提供了前所未有的语音生成体验。以下是AIbase对Eleven v3Alpha版的独家解读。突破性功能:不仅会说话，还能“演戏”Eleven v3Alpha版的最大亮点在于其强大的情感表达能力

2025年6月6号 9:05

2.6k

开源免费语音克隆模型ChatterBox AI，性能测试超ElevenLabs

人工智能语音技术领域迎来重大突破!加拿大初创公司Resemble AI近日发布其首款开源文本转语音（TTS）模型ChatterBox，采用MIT许可证。这一模型以其卓越的语音克隆能力、情绪控制功能和超低延迟特性，迅速成为行业焦点，甚至在盲测中超越了知名闭源模型ElevenLabs。ChatterBox的发布背景ChatterBox是Resemble AI在语音合成领域的最新成果，基于0.5亿参数的Llama架构，训练数据高达50万小时的精选音频。相较于传统闭源TTS解决方案，ChatterBox以开源形式发布，旨在为开发者、创作者和企业提供高质量且自

2025年6月4号 9:06

2.7k

ElevenLabs推全新语音交互平台Conversational AI 2.0：AI语音助手比真人还懂你

近日，ElevenLabs正式推出了其全新一代语音交互平台Conversational AI2.0，以更自然、更智能、更高效的语音交互体验引发业界热议。这一升级版本在对话流畅性、多语言支持和企业级应用能力上实现重大突破，不仅能精准捕捉用户对话节奏，还能无缝切换多语言并从企业知识库提取信息，为客服、营销和内容创作等领域带来全新可能。自然对话新体验:告别尴尬中断Conversational AI2.0引入了先进的轮流对话模型，通过实时分析用户的语音提示（如“呃”“嗯”等），精准判断何时发言、何时等待，

2025年6月3号 10:15

4.6k

Resemble AI开源TTS Chatterbox ，性能直逼超越ElevenLabs

近年来，文本转语音（TTS）技术在人工智能领域的应用日益广泛，从智能助手到内容创作，TTS正在重塑我们与声音交互的方式。一款名为Chatterbox的开源TTS模型横空出世，凭借其卓越的性能和创新功能，迅速成为行业焦点。Chatterbox:开源TTS的革命性突破Chatterbox由Resemble AI开发，基于MIT许可证完全开源，允许开发者自由使用和修改。这款模型基于0.5B规模的LLaMA架构，训练数据超过50万小时的精选音频，性能直逼甚至超越部分闭源系统。据悉，在近期盲测中，63.75%的听众更偏好Chatterbox的语音输出

2025年5月29号 10:44

4.7k

MiniMax Speech-02碾压OpenAI与ElevenLabs，登顶全球TTS榜首

MiniMax Audio推出的Speech-02系列语音模型席卷全球，强势登顶Artificial Analysis Speech Arena和Hugging Face TTS Arena两大权威榜单，力压ElevenLabs、OpenAI等国际顶尖竞争对手。这款模型以超高语音逼真度和多语言支持惊艳业界，成为AI语音技术的全新标杆。AIbase综合最新动态，深入解析Speech-02的技术亮点及其对行业的深远影响。双榜夺冠:客观与主观兼优Speech-02系列包括Speech-02-HD和Speech-02-Turbo两款模型，分别针对高保真和实时应用场景优化。在Artificial Analysis Speech Arena的ELO评分中，Speech-02-HD以卓越的语音质量

2025年5月16号 14:49

6.5k

ElevenLabs推可定制音效控制面板工具SB-1 Infinite Soundboard

人工智能音频领域的领军企业ElevenLabs再次掀起行业波澜，于今日正式推出一款基于 AI 的可定制音效控制面板工具——SB-1Infinite Soundboard。用户可以通过点击按钮播放、组合、循环各种音效，或者可以通过文本提示生成全新的 AI 音效。技术亮点:文本驱动的无限音效生成SB-1Infinite Soundboard的核心在于其基于Text-to-SFX模型的音效生成能力。用户只需通过文字描述所需音效，例如“暴风雨中的雷鸣”或“复古科幻飞船引擎声”，SB-1即可实时生成高质量、逼真的音效。官方表示，该工具不仅能生成

2025年5月16号 10:23

7.5k

Luma Ray2 Camera Concepts API 发布：AI 视频生成迈向电影级控制

Luma AI 宣布其旗舰视频生成模型 Ray2的 Camera Concepts API 正式上线，为开发者提供了前所未有的电影级镜头控制能力。结合此前推出的 Camera Motion Concepts 和 Camera Angle Concepts，这一 API 的发布标志着 AI 视频生成技术在创意控制和生产效率上的重大突破。Camera Concepts API:赋予开发者电影级创意控制Luma Ray2的 Camera Concepts API 允许开发者通过简单的 API 调用，精准控制 AI 生成视频中的镜头运动和角度。该 API 整合了 Ray2的 Camera Motion Concepts（包括平移、轨道、起重机镜头等20余种运动模式）和 Camera Angle

2025年4月30号 10:37

4.2k

伦敦AI创意工作室 Wonder 获 300 万美元融资 ElevenLabs、OpenAI负责人参与投资

近日，位于伦敦的创意工作室 Wonder 宣布成功获得300万美元的种子轮融资，融资由 LocalGlobe 领投，其他投资者包括澳大利亚风险投资公司 Blackbird、AI 语音初创公司 ElevenLabs 的联合创始人 Mati Staniszewski、OpenAI 初创团队负责人 Laura Modiano、以及谷歌 DeepMind 的设计负责人 Ammaar Reshi 等。这家工作室致力于利用人工智能技术制作娱乐和广告领域的电影。图源备注:图片由AI生成，图片授权服务商MidjourneyWonder 的创始人 Justin Hackney 是一位获得 BAFTA 奖的电影制片人，曾担任 ElevenLabs 的创意总监，而 CEO Xa

2025年4月14号 14:03

6.4k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

Pika 新增 Lip Sync 功能 实现音唇同步效果