信息

AI新闻资讯

探索AI前沿，掌握行业发展趋势

AI 商用·开源产品库

精准筛选产品，多维度产品调研

AI 产品排行榜

热门AI产品实力、热度、年/月/日排行

AI产品提交

提交AI产品信息，助力产品推广和用户转化

工具

AI工具导航

一站式AI工具指南，快速找到你需要的工具

信息

模型库

涵盖各类AI模型，满足你的开发与研究需求

大模型排行榜

热门AI大模型性能、热度、年/月/日排行

模型供应商

寻找优质模型提供商，获取可靠模型支持

工具

大模型选型对比

多维度对比大模型，找到最适合你的模型

大模型费用计算器

精准计算大模型使用成本，合理规划预算

大模型竞技场

多模型实时评测，模型输出结果快速比对

信息

MCP服务端

聚集热门MCP服务，快速找到适合你的服务

MCP客户端

轻松接入MCP客户端，调用强大的AI能力

MCP教程与实践

学习MCP使用技巧，从入门到精通

MCP排行榜

热门MCP服务性能排行，帮你找到最佳选择

MCP服务提交

发布你的MCP服务，推广你的MCP服务

工具

MCP实验场

自由测试MCP服务，线上快速体验

MCP服务调试器

快速测试MCP服务，快速上线

工具

GEO全景分析平台

一站式GEO品牌洞察提升AI搜索转化率

GEO品牌监控分析

分析并追踪人工智能模型如何引用您的品牌

GEO排名查询工具

检测品牌在AI平台中的可见度

服务

GEO 大模型推荐优化

通过AI搜索优化服务，让品牌在AI中实现霸屏

工具

模型个人电脑配置检测器

一键检测电脑配置，研判运行模型的兼容性

模型部署服务器配置计算器

根据算力需求，推荐匹配的服务器配置

AI应用指南

Head Direction 相关的热门 GitHub AI项目仓库

发现与 Head Direction 相关的最受欢迎的开源项目和工具，了解最新的开发趋势和创新。

SadTalker

audio-driven-talking-face

CVPR 2023论文《SadTalker：学习用于风格化音频驱动单图像说话人动画的真实3D运动系数》

13415

1个月前

+4today

AudioGPT

audio

AudioGPT：理解和生成语音、音乐、声音和会说话的头像

10210

1个月前

LiveTalking

实时互动流媒体数字人

Thin Plate Spline Motion Model

deep-learning

【CVPR 2022】基于薄板样条的图像动画运动模型

3593

1个月前

-1today

Deepgaze

cnn

一个用于人机交互的计算机视觉库。它利用卷积神经网络实现头部姿态和凝视方向估计，通过反向投影实现肤色检测，以及运动检测、跟踪和显著性地图生成。

1849

1个月前

Deep Head Pose

基于PyTorch的深度学习头部姿态估计

Fantasy Talking

diffusion

FantasyTalking：通过一致的动作合成生成逼真的会说话肖像

1598

1个月前

+1today

Aitrack

六自由度头部追踪软件

1350

1个月前

+2today

VideoChat

asr

这个实时语音交互数字人，采用先进的端到端语音方案（GLM-4-Voice - THG）或级联方案（ASR-LLM-TTS-THG），能根据您的需求定制形象和音色，甚至支持音色克隆。无需额外训练，首包延迟仅需3秒。

1154

1个月前

CVPR2022 DaGAN

deepfake

CVPR2022论文《深度感知生成对抗网络用于说话人头部视频生成》的官方代码

995

1个月前

-1today

JoyVASA

audio-driven-talking-face

基于扩散模型的肖像和动物动画

844

1个月前

TranAD

adversarial-learning

基于Transformer、自调节和对抗训练的异常检测（VLDB'22论文）

645

1个月前

Wav2lip_288x288

audio-driven-talking-face

638

2个月前

Deepdive Llama3 From Scratch

attention

一步一步完成Llama 3推理过程，掌握核心概念，理解过程推导，并实现代码。

612

1个月前

Ditto Talkinghead

audio-driven-portrait-animations

Ditto：用于可控实时说话头像合成的运动空间扩散模型

610

1个月前

+6today

Awesome Deepfake Generation And Detection

deepfake-detection

深度伪造技术生成与检测综述

595

1个月前

DeepXi

a-priori-snr-estimator

Deep Xi：一种基于TensorFlow 2/Keras实现的深度学习先验信噪比估计方法，用于语音增强和鲁棒性语音识别。

519

1个月前

DAD 3DHeads

3d-computer-vision

DAD-3DHeads项目官方仓库：一个用于单图像三维头部对齐的大规模、高精度、多样化数据集（CVPR 2022）。

485

1个月前

+1today

ACTalker

avatar

ACTalker：一个端到端的视频扩散框架，用于生成会说话的头部视频，支持单一和多信号控制（例如，音频、表情）。

427

1个月前

Rt_gene

blink-detection-algorithm

实时眼动追踪与眨眼估计：自然环境下的应用

425

1个月前

+1today

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

模型库

大模型排行榜

模型供应商

大模型选型对比

大模型费用计算器

大模型竞技场

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

GEO全景分析平台

GEO品牌监控分析

GEO排名查询工具

GEO 大模型推荐优化

模型个人电脑配置检测器

模型部署服务器配置计算器

Head Direction 相关的热门 GitHub AI项目仓库

SadTalker

AudioGPT

LiveTalking

Thin Plate Spline Motion Model

Deepgaze

Deep Head Pose

Fantasy Talking

Aitrack

VideoChat

CVPR2022 DaGAN

JoyVASA

TranAD

Wav2lip_288x288

Deepdive Llama3 From Scratch

Ditto Talkinghead

Awesome Deepfake Generation And Detection

DeepXi

DAD 3DHeads

ACTalker

Rt_gene