美团LongCat团队发布视频生成模型LongCat-Video,基于DiT架构,能精准重构真实世界动态,支持文生视频、图生视频和视频续写功能。这标志着美团在世界模型领域取得重要进展,该模型是下一代AI核心引擎,助力AI更好地理解和预测现实世界。
腾讯自研混元图像3.0大模型在LMArena文生图榜单登顶第一,超越全球26个模型及多个顶尖闭源模型。该排名基于全球用户真实投票,无算法干预,体现实际使用体验。
快手可灵2.5Turbo模型在AI视频生成领域表现突出,于9月23日推出后,在Artificial Analysis基准测试中,图生视频和文生视频分别获1329和1252分,超越Veo3等对手,登顶全球榜单第一。
AigcPanel v1.3.0 版本重磅升级,新增384种模型支持,实现文生图与图生图功能,大幅提升直播体验。作为开源免费AI数字人系统,界面友好、操作简单,适合新手。支持智能直播、视频合成、声音合成与克隆替换,功能全面,助力创作更便捷。
VORAvideo连接多AI模型,支持文生视频、图生视频,享Sora 2特惠
NanoEditor是一体化AI图像生成平台,支持文生图、图生图及风格转换。
基于 Next.js 的多模型 AI 绘画应用,支持文生图和图生图功能。
首个同时支持文生和图生的3D开源模型
gtmepm
simpletuner-lora 是一个基于 stabilityai/stable-diffusion-3.5-medium 的 LyCORIS 适配器,专门用于文生图等图像生成任务。该模型通过 LoRA 微调技术实现,主要使用验证提示为'A photo-realistic image of a cat'进行训练。
elixirx
charu-anime-lora是一个基于LoRA技术的文生图模型,专门用于生成精美的动漫风格图像,以Qwen/Qwen-Image为基础模型,为动漫图像创作提供高效解决方案。
John6666
基于Stable Diffusion XL技术的文生图模型,专门生成动漫风格女孩图像,为创意设计领域提供支持
Illustrious XL v1.0是基于OnomaAIResearch/Illustrious-xl-early-release-v0训练的文生图模型,专门用于生成多种艺术风格的动漫女性图像,在图像生成领域具有应用价值
lodestones
Chroma1-Base是一个拥有89亿参数的文生图基础模型,基于FLUX.1-schnell架构构建,采用Apache 2.0许可证。该模型专为微调设计,为开发者、研究人员和艺术家提供强大而中立的基础,用于创建专门的生成模型。
基于Stable Diffusion XL架构的文生图模型,专注于生成具有亚洲风格的写实图像,适用于多种创意场景和艺术创作
DFloat11
采用DFloat11无损压缩技术的文生图模型,体积缩减70%的同时保持100%精度
Gen-Verse
MMaDA是一种新型多模态扩散基础模型,在文本推理、多模态理解和文生图等领域表现卓越。
aiyouthalliance
基于Stable Diffusion 1.5构建的免费文生图模型,通过多个LoRA模块微调,生成的图像遵循CC0许可协议,可免费商用无需署名。
quzo
基于FLUX.1-dev的LyCORIS适配器,专注于文生图和图生图任务,支持多种分辨率输出。
guokee
这是一个为FLUX.1-dev文生图模型训练的LoRA适配器,支持通过diffusers或ComfyUI调用,用于生成特定风格的图像。
Eviation
Flex.2-preview 是一个文生图模型,提供多种量化版本,支持 Safetensors 和 GGUF 格式。
Skywork
SkyReels V2是一个无限长度电影生成模型,采用自回归扩散强制架构,支持文生视频和图生视频任务,能够生成高质量的长视频内容。
bghira
Stable Diffusion 3.5 Medium 是一个基于扩散模型的文生图/图生图模型,能够根据文本提示生成高质量的图像。
ShanZard
基于stabilityai/stable-diffusion-3.5-large的LyCORIS适配器,专注于文生图和图生图任务
基于fal/AuraFlow训练的标准PEFT LoRA模型,专注于生成多摩君形象的文生图和图生图任务。
ajiprakoso
这是一个专为FLUX.1-dev文生图模型定制的LoRA适配器,可与diffusers或ComfyUI配合使用。
基于Stable Diffusion和Stable Diffusion XL技术的文生图模型,能够生成逼真、具有良好解剖结构、出色眼睛表现以及优质对比度和阴影效果的图像。
Unmapped2895
基于FLUX.1-dev的PEFT LoRA模型,专注于文生图与图生图任务,特别擅长生成具有高度细节和艺术风格的女性形象。
codermert
这是一个为FLUX.1-dev文生图模型训练的LoRA适配器,可用于生成特定风格的图像。
基于TypeScript的MCP服务器,集成阿里云通义万相的文生图和文生视频API,支持异步任务处理和MCP协议规范
基于TypeScript的MCP服务器,集成通义万相的文生图和文生视频API,支持异步任务处理和MCP协议规范。
基于MCP协议的豆包Seedream 4.0文生图服务器,支持AI图片生成、自动下载和本地存储,可集成到Claude Code中使用