Kling AI发布2.6版本,新增原生音频生成功能,支持中英双语对白、歌唱与音效同步输出,实现文本到视频的完整创作流程,标志着AI视频进入有声时代。
阿里巴巴通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union模型,扩展Z-Image系列图像生成生态。该模型强化了精确控制与创意生成能力,已在Hugging Face上线,采用Apache2.0许可,支持商用。
阿里通义发布生图模型Z-Image,首日登顶Hugging Face趋势榜,下载量达50万次。该模型仅6亿参数,却能媲美大型模型,精细还原皮肤、发丝、光影和纹理,构图氛围出色。同时推出优化版Z-Image-Turbo,仅需8步即可生成高质量图像。
阿里通义实验室推出Z-Image-Turbo模型,仅6B参数却媲美20B+闭源模型。在RTX4090上2.3秒完成1024×1024图像渲染,显存占用13GB。支持8步采样输出印刷级画质,兼容3060 6G等消费级显卡,显存需求最高16G。模型精准理解复杂中文提示,如“夜晚的阳光”等抽象描述。
AiAF
D-ART - LoRA - Z-Image-Turbo 是一个基于 Tongyi-MAI/Z-Image-Turbo 基础模型的图像生成模型。它是一个LoRA(Low-Rank Adaptation)适配器,旨在为生成图像注入特定的“D-ART”艺术风格。该风格以生成自信、充满活力的年轻女性角色插画为特点,尤其强调角色的曲线和动态姿态。用户通过使用特定的触发词即可激活该风格,生成具有统一美学特征的多样化图像。
drbaph
Z-Image(造相)是一个拥有60亿参数的高效图像生成基础模型,专门解决图像生成领域的效率和质量问题。其蒸馏版本Z-Image-Turbo仅需8次函数评估就能达到或超越领先竞品,在企业级H800 GPU上可实现亚秒级推理延迟,并能在16G VRAM的消费级设备上运行。
T5B
Z-Image-Turbo 是经过 FP8 E5M2 和 E4M3FN 格式量化的图像处理模型,基于原始 Tongyi-MAI/Z-Image-Turbo 模型优化,在保持性能的同时显著减少模型大小和推理资源需求。
Tongyi-MAI
Z-Image是一款功能强大且高效的图像生成模型,拥有60亿参数。它能有效解决图像生成领域在效率、质量和功能多样性方面的问题,为用户提供高质量的图像生成和编辑服务。