AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航 MCP

GPT-SoVITS低成本AI音色克隆软件，完美复刻HeyGen核心功能

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Jan 18, 2024

107

GPT-SoVITS是一款功能强大的AI音色克隆软件，通过简单输入5秒的声音样本，即可享受文字转语音的便利。产品支持跨语言，提供多种辅助工具，且微调模型仅需1分钟训练数据。支持在Windows环境下运行，为用户提供更灵活的使用体验。

AI音色克隆 GPT-SoVITS HeyGen

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

AI变天！HeyGen发布“有灵魂”的数字人Avatar IV 一张照片秒变“戏精”数字人，表情比真人还细腻

全球知名AI视频平台HeyGen正式发布Avatar IV数字人模型。基于创新的“扩散式音频驱动表情引擎”，用户仅需一张照片、一段30秒内的语音或文本脚本，即可生成高度逼真的数字人视频，表情、动作与语义情感深度同步，引发行业广泛关注。逼真演绎，源于先进技术内核Avatar IV仅需用户上传一张照片（支持侧脸及多角度图像）和30秒内的语音/脚本，即可生成动态数字人。新模型通过分析语音的节奏、语调及情绪，驱动数字人的面部表情、微动作(如点头、停顿)及肢体语言，显著提升真实感。例

2025年5月8号 11:49

12.7k

开源版HeyGen来了！Heygem：精准克隆外貌和声音，支持对口型

Heygem 是一款为 Windows 系统设计的全新离线视频合成工具，它能精准克隆用户的外貌和声音，将个人形象数字化。该工具支持用户通过文本和语音驱动虚拟形象进行视频创作，整个过程无需互联网连接，确保用户隐私安全。Heygem 的核心功能包括精确的外貌和声音克隆。其使用先进的 AI 算法，能够高精度地捕捉用户的面部特征与轮廓，构建出逼真的虚拟模型。同时，它还能克隆用户的声音，捕捉到语音的细微特征，支持多种声音参数设置，创造出高度相似的克隆效果。此外，Heygem 具备文本和

2025年3月10号 9:46

21.8k

AI日报：百川智能深度思考模型Baichuan-M1-preview；OpenAI发布首个AI智能体Operator；HeyGen新增数字人运动控制功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、百川智能发布全场景深度思考模型Baichuan-M1-preview已在百小应上线百川公司今日推出了Baichuan-M1系列模型，其中包括全场景深度思考模型Baichuan-M1-preview和开源医疗增强大模型Baichuan-M1-14B。此举不仅推动了人工智能的民主化，也为数百万用户提供了前沿技术的接入，同时确保了付费用户的价值体验。

2025年1月24号 15:21

2.8k

HeyGen推出数字人运动控制功能能弹乐器还能跳舞

视频生成领域迎来革命性突破。人工智能公司HeyGen最新发布的数字人运动控制系统，首次实现虚拟形象的大幅度肢体动作操控。这项技术突破使数字人不仅能完成基础的头部微表情，更能流畅执行弹奏乐器、舞蹈表演等复杂肢体动作，甚至精确控制手指关节完成特定手势。演示视频中，虚拟角色手持鲜花的自然抓握动作引发行业关注。尽管当前展示仍以单一物品操作为主，但技术底层已具备物体交互能力框架。分析人士指出，该功能已具备商品展示应用潜力，未来迭代可能突破现有展示形

2025年1月24号 14:26

8.9k

HeyGen推全新数字人技术集成Sora，演技超越真人

近日，HeyGen 公司宣布将其数字人模型与 OpenAI 的 Sora 模型实现集成，引发业界广泛关注。这一技术突破意味着，我们即将迎来前所未有的、由人工智能驱动的“会说话的虚拟形象”视频。这些虚拟形象不仅能够无缝地融入 Sora 生成的场景中，更在某些方面超越了真人演员的表现，为视频创作带来了无限的可能性。长期以来，传统视频拍摄依赖真人演员，不仅拍摄成本高昂，后期调整也十分繁琐。如今，有了 HeyGen 和 Sora 的强强联合，情况将发生巨大改变。新技术的优势在于，用户可以对虚

2025年1月8号 11:05

10.2k

HeyGen App：打造 AI 数字人的终极神器，支持 175 种以上视频语言翻译

HeyGen 是一个极具创新性的 AI 数字人视频生成平台，于 2022 年 7 月 29 日正式上线运营。其致力于将视觉叙事打造成为所有人皆可轻松触及的工具。在 HeyGen 上用户能够迅速创建 AI 数字人（虚拟 Avatar），无需借助相机或演员，仅在几分钟内即可生成高度逼真的数字人视频。同时，通过 AI 语音翻译及口型同步功能，可将视频翻译为超过 175 种语言或方言。目前，HeyGen 已被广泛应用于市场营销、销售支持、客户服务以及培训等诸多不同的应用场景。图片来自 HeyGen2023 年 4 月，其创始人 Joshua Xu 在

2024年11月22号 16:07

18.8k

AI日报：抖音“V项目”上线AI分身功能；微信公众号推AI音色克隆功能；Kimi数学推理模型k0-math；AI自习室悄悄兴起

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、微信公众号悄然推出AI音色克隆功能，尚未全量上线这一新功能为用户提供了个性化的阅读体验，允许他们通过自己的声音朗读文章，增强了内容的情感表达。苹果的这一举措将推动智能家居市场的发展，并为用户提供更全面的家庭安全解决方案。

2024年11月18号 15:56

1.2k

微信公众号悄然推出AI音色克隆功能，尚未全量上线

据AI自媒体 “数字生命卡兹克”消息，微信公众号悄然上线了一项新功能 ——AI 音色克隆，旨在提升用户的阅读体验。据称，这一更新体现在公众号版本2.29.1中，让用户可以通过自己的声音朗读文章，极大增强了内容的个性化。用户在后台设置中，能够找到 “朗读音色” 选项，从而创建专属的音色。创建音色的过程相对简单，用户只需现场朗读一段文本，系统会快速进行音色克隆。为了确保安全性，微信采取了实时录音的方式，而不是允许用户上传随意的音频。用户在完成音色克隆后，

2024年11月18号 14:09

4.8k

AI日报：国产逆袭！Yi-Lightning排行超越GPT-4o；阿里推翻译神器Marco-MT；开源版Heygen来了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、国产AI逆袭！开发者可享受丰富的客户端库，实际应用中表现出色，支持并发处理和初始时间规范化，部署简便。

2024年10月16号 15:53

2.1k

开源版Heygen来了？TANGO可根据音频无限生成匹配的全身视频

TANGO，一个接近HeyGen的强大解决方案。这个创新项目不仅支持面部和唇形同步，更令人惊叹的是，它能够生成与音频完美匹配的全身动作视频。TANGO的核心优势在于其独特的生成逻辑。首先，系统会分析用户提供的短视频样本，构建一个包含各种身体姿势和动作转换的"动作图谱"。然后，它会根据输入的音频内容，选择最佳的动作序列。最后，通过生成流畅的过渡帧，创造出自然逼真的动作视频。这种方法使得TANGO能够从短短几十秒的样本视频中，生成无限量的、与音频匹配的全身动作视频

2024年10月16号 10:26

16.7k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图