美团LongCat团队开源了LongCat-Image图像生成模型,该模型拥有6B参数,在文生图和图像编辑领域表现优异,旨在平衡性能与使用门槛,填补开源与闭源模型之间的技术空白。
快手旗下可灵AI推出首个“音画同出”模型可灵2.6,能同时生成画面、语音、音效和环境氛围,打通音画世界。该模型提供“文生音画”和“图生音画”两种创作路径,用户可通过一句话或图片快速生成完整视频,提升创作体验。
可灵AI公司宣布,其O1视频大模型已全量开放。该模型采用多模态视觉语言统一架构,支持文字、图像、视频融合输入,并引入思维链推理,号称全球首个统一多模态视频大模型。它可一次性完成文生视频、图生视频、局部编辑及镜头延展等任务,无需分步操作。
美团LongCat团队发布视频生成模型LongCat-Video,基于DiT架构,能精准重构真实世界动态,支持文生视频、图生视频和视频续写功能。这标志着美团在世界模型领域取得重要进展,该模型是下一代AI核心引擎,助力AI更好地理解和预测现实世界。
VORAvideo连接多AI模型,支持文生视频、图生视频,享Sora 2特惠
基于 Next.js 的多模型 AI 绘画应用,支持文生图和图生图功能。
首个同时支持文生和图生的3D开源模型
多模型对话,文生图
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$6
$24
$2
$20
hunyuanvideo-community
混元图像2.1是基于diffusers库的文生图模型,能够根据文本描述生成高质量的图像,支持中英双语输入,为用户提供便捷的图像生成体验。
gtmepm
simpletuner-lora 是一个基于 stabilityai/stable-diffusion-3.5-medium 的 LyCORIS 适配器,专门用于文生图等图像生成任务。该模型通过 LoRA 微调技术实现,主要使用验证提示为'A photo-realistic image of a cat'进行训练。
elixirx
charu-anime-lora是一个基于LoRA技术的文生图模型,专门用于生成精美的动漫风格图像,以Qwen/Qwen-Image为基础模型,为动漫图像创作提供高效解决方案。
John6666
基于Stable Diffusion XL技术的文生图模型,专门生成动漫风格女孩图像,为创意设计领域提供支持
Illustrious XL v1.0是基于OnomaAIResearch/Illustrious-xl-early-release-v0训练的文生图模型,专门用于生成多种艺术风格的动漫女性图像,在图像生成领域具有应用价值
lodestones
Chroma1-Base是一个拥有89亿参数的文生图基础模型,基于FLUX.1-schnell架构构建,采用Apache 2.0许可证。该模型专为微调设计,为开发者、研究人员和艺术家提供强大而中立的基础,用于创建专门的生成模型。
基于Stable Diffusion XL架构的文生图模型,专注于生成具有亚洲风格的写实图像,适用于多种创意场景和艺术创作
DFloat11
采用DFloat11无损压缩技术的文生图模型,体积缩减70%的同时保持100%精度
Gen-Verse
MMaDA是一种新型多模态扩散基础模型,在文本推理、多模态理解和文生图等领域表现卓越。
aiyouthalliance
基于Stable Diffusion 1.5构建的免费文生图模型,通过多个LoRA模块微调,生成的图像遵循CC0许可协议,可免费商用无需署名。
guokee
这是一个为FLUX.1-dev文生图模型训练的LoRA适配器,支持通过diffusers或ComfyUI调用,用于生成特定风格的图像。
Eviation
Flex.2-preview 是一个文生图模型,提供多种量化版本,支持 Safetensors 和 GGUF 格式。
Skywork
SkyReels V2是一个无限长度电影生成模型,采用自回归扩散强制架构,支持文生视频和图生视频任务,能够生成高质量的长视频内容。
bghira
Stable Diffusion 3.5 Medium 是一个基于扩散模型的文生图/图生图模型,能够根据文本提示生成高质量的图像。
基于fal/AuraFlow训练的标准PEFT LoRA模型,专注于生成多摩君形象的文生图和图生图任务。
ajiprakoso
这是一个专为FLUX.1-dev文生图模型定制的LoRA适配器,可与diffusers或ComfyUI配合使用。
基于Stable Diffusion和Stable Diffusion XL技术的文生图模型,能够生成逼真、具有良好解剖结构、出色眼睛表现以及优质对比度和阴影效果的图像。
Unmapped2895
基于FLUX.1-dev的PEFT LoRA模型,专注于文生图与图生图任务,特别擅长生成具有高度细节和艺术风格的女性形象。
codermert
这是一个为FLUX.1-dev文生图模型训练的LoRA适配器,可用于生成特定风格的图像。
Remade-AI
基于Wan2.1 14B I2V 480p模型训练的LoRA,可为图像主体添加专业级滑轨变焦镜头效果,适用于图像转视频(I2V)和文生视频(T2V)任务。