元宝推出“一句话生视频”新功能,用户无需剪辑基础,输入一句话或上传图片即可快速生成生动视频。该功能基于腾讯开源的HunyuanVideo1.5模型,让普通人轻松成为视频创作者,极大简化了视频制作流程。
元宝App推出混元图像3.0,用户输入一句话即可生成表情包、四格漫画、设计配图等创意内容。升级提升了图像生成的智能化水平,让创作更直观生动。针对社交媒体中表情包日益重要的需求,该功能简化了用户操作,只需简单文字即可快速生成多样化图像。
谷歌AI笔记应用NotebookLM推出视频概览新功能,可将复杂信息转化为带旁白的幻灯片,提升学习体验。该功能能自动提取用户上传的图片、图表等资料生成主题视频,已在2025年I/O大会展示雏形。同时应用界面"工作室"标签页完成视觉更新,新功能将陆续向所有用户开放。目前仅支持英文,未来计划扩展多语言版本并优化内容呈现形式,使学习过程更生动高效。
谷歌AI视频工具Veo3迎来重大升级:用户上传单张静态照片即可生成高质量音视频内容。新功能支持保持角色多镜头一致性,提供推镜头等专业运镜选项,无需文本提示也能生成自然动画。用户可在Flow平台选择不同质量模式(Fast模式20积分,Quality模式100积分),测试显示生成效果生动自然。这一突破性技术展现了AI在视频创作领域的巨大潜力,引发广泛关注。
音频驱动的唇形同步生成器,可将图片转为无限长度生动视频,免费试用。
AI图像转视频工具,上传照片即可生成生动视频。
由 Google 训练的 AI 模型,用于对野生动物相机陷阱图像中的物种进行分类。
将静态图片转化为生动的动画视频。
Google
$0.7
Input tokens/M
$2.8
Output tokens/M
1k
Context Length
Anthropic
$21
$105
200
Alibaba
-
$1
$10
256
$2
$20
$3.9
$15.2
64
Bytedance
$0.8
$0.15
$1.5
128
Baidu
32
John6666
XL-Sat-IOR是一款基于Stable Diffusion和Stable Diffusion XL架构的文本到图像生成模型,能够生成具有高度真实感、丰富色彩、电影质感、精细细节、出色光影和生动面部表情的图像。
Daverrrr75
Lenovo Ultrareal 是基于LoRA技术的文本到图像生成模型,能够生成具有戏剧性光影、模糊效果和2000年代街头摄影氛围的生动图像,呈现出业余摄影的独特质感。
FFusion
FFUSION AI是一款基于Stable Diffusion 2.1技术开发的潜在扩散模型,专注于文本到图像生成。该模型通过先进的扩散技术将文本提示转化为生动的艺术作品,支持多种创意和研究应用场景。