最新研究发现,通过短时间训练可显著提升识别AI合成人脸的能力。实验中,参与者对StyleGAN3生成的假脸进行辨别,未经训练时识别效果有限,但训练后准确率大幅提高。
字节跳动发布FaceCLIP视觉-语言模型,支持通过文本和参考图像生成身份一致的人脸图像。该模型在人脸语义处理领域实现突破,能根据输入照片和文字描述,保持原始身份特征的同时创造多样化新图像。
阿里开源Qwen-Image-Edit图像编辑模型,具备精准文本编辑和语义外观双控能力,中文渲染效果超越GPT-4o。该模型由阿里通义千问团队开发,采用双重编码机制,为开发者提供强大AI工具,助力技术趋势洞察与创新应用探索。
小红书AIGC团队发布DynamicFace可控人脸生成技术,专门优化图像和视频中的人脸融合任务,实现高质量、高一致性的人脸置换效果。该技术是AI内容生成领域的重要突破,在娱乐社交和影视行业具有广泛应用前景。
免费 AI 视频生成器,支持人脸互换与动画效果。
一个全能的AI平台,提供免费AI视频生成器(文本、图像、亲吻)、人脸交换、AI艺术生成器和发型更换!
PixNova AI是一款强大的AI图片生成和设计工具,提供多种AI功能,包括人脸交换、图片编辑等。
JoyGen 是一种音频驱动的 3D 深度感知的说话人脸视频编辑技术。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
SadraCoding
SDXL-Deepfake-Detector 是一款精准检测 AI 生成人脸的工具,专注于维护数字世界的真实性,为抵御视觉虚假信息提供隐私保护且开源的解决方案。该模型通过微调预训练模型实现轻量级且高准确率的检测。
hajar001
本模型使用StyleGAN1架构,并结合StyleGAN2正则化技术进行训练,能够生成分辨率为128×128的逼真人脸图像。模型基于FFHQ数据集训练,支持风格混合、噪声注入和截断技巧等特性。
hyper1girl
Noemie LoRA是专为Qwen模型设计的最逼真角色LoRA,采用独特的多层训练方法,生成的图像人脸一致且极具真实感。
John6666
基于Stable Diffusion XL架构的文本到图像模型,擅长生成高度逼真的图像,特别在人脸和手部细节处理上表现出色。
dzhov
这是一个基于扩散模型的人物与水母结合体生成模型,能够生成类似水彩风格的人脸图像。
Super-shuhe
基于FaceID-6M数据集训练的人脸ID定制模型,支持根据文本描述生成定制化人脸图像。
jdh-algo
JoyHallo是一个专注于普通话的音频驱动人脸动画生成模型,能够根据普通话语音生成逼真的面部动画。
LittleNyima
在huggan/anime-faces数据集上训练的DDPM模型,用于生成64x64像素的动漫风格人脸图像。
phil329
基于稳定扩散架构的精调版本,采用低秩适应(LoRA)技术,专注于高质量人脸图像生成。
TencentARC
PhotoMaker是一个文本到图像生成模型,能够通过输入的人脸照片和文字提示快速生成定制化的照片或绘画作品,无需训练。
h94
IP-Adapter-FaceID 是一个基于人脸识别的文本到图像生成模型,能够根据人脸ID嵌入生成各种风格的图像。
amirali900
这是一个基于PyTorch和Diffusers库的无条件图像生成模型,专门用于生成动漫风格的人脸图像。
基于扩散模型的无条件动漫人脸生成模型,可从随机噪声生成动漫风格人脸图像
stablediffusionapi
基于LAION人脸数据集训练的ControlNet模型,用于生成带精确面部表情控制的图像
sazyou-roukaku
BracingEvoMix是基于OpenBraβ和OpenBra的文本到图像生成模型系列,专注于降低高风险模型混入概率,并在亚洲人脸多样性和照片真实感方面表现优异。
一个基于MCP协议的人脸生成服务器,可生成多种形状的人脸图像
一个基于GPTNB API的Midjourney图像生成服务器,提供图像生成、编辑、人脸替换等功能