Meta提出基于多模态感知的AI面部表情生成技术,通过分析用户身体动作、语音等多维度信息,在虚拟互动中实现自然生动的表情生成,克服了传统方案依赖昂贵硬件或仅同步音频的局限,尤其适用于用户活动复杂、面部遮挡或仅通过身体传达信息的场景。
MiniMax发布海螺2.3模型,实现文字转视频技术重大突破。该模型以电影级现实主义表现,在动作流畅度、面部微表情和物理交互三大维度达到新高度:动作轨迹符合真实力学,面部表情细腻逼真,物理交互真实自然。这标志着AI视频生成正式迈入专业影视时代。
生数科技9月25日发布新一代图生视频模型Vidu Q2,主打“AI演戏”功能。该模型突出细微表情生成,结合推拉运镜技术,提升视频生成速度与语义理解。AI可精准模拟自然面部表情变化,适应不同场景,带来全新视觉体验。
英伟达开源生成式AI模型Audio2Face,提供算法、SDK及训练框架,助力游戏和3D应用开发。该模型通过分析音频音素与语调,实时驱动虚拟角色面部动作,实现精准口型同步和自然表情。适用于游戏、影视、客服等领域,提升虚拟角色交互体验。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
John6666
XL-Sat-IOR是一款基于Stable Diffusion和Stable Diffusion XL架构的文本到图像生成模型,能够生成具有高度真实感、丰富色彩、电影质感、精细细节、出色光影和生动面部表情的图像。
Fihade
基于自拍或肖像生成风格一致的表情符号字符包的LoRA模型,支持面部特征检测与服装元素融合,输出高分辨率PNG贴纸
JujoHotaru
由十条蛍创作的动漫风格LoRA微调模型合集,专注于文生图任务中的面部表情和特效生成
stablediffusionapi
基于LAION人脸数据集训练的ControlNet模型,用于生成带精确面部表情控制的图像
Manseo
Colorful-v4.5-Plus 是由 Anything-v4.5、AbyssOrangeMix3 和 ProtogenInfinity 合并而成的文本生成图像模型,优化了色彩表现、环境、手指、面部表情及服装细节。