美团LongCat团队开源了LongCat-Image图像生成模型,该模型拥有6B参数,在文生图和图像编辑领域表现优异,旨在平衡性能与使用门槛,填补开源与闭源模型之间的技术空白。
可灵AI公司宣布其O1视频大模型已全量上线,采用统一多模态架构,支持文字、图像等多种输入方式,实现一句话生成视频。
阿里巴巴开源Z-Image图像模型,支持中英双语文字渲染,仅6B参数实现高效图像生成与编辑,视觉质量优秀。该模型由通义实验室开发,聚焦AI技术趋势,助力开发者洞悉创新应用。
Nano Banana2 AI图像模型实现重大突破,攻克复杂细节还原难题,通过模拟人类多阶段创作流程,使图像生成从随机出图迈向可控精修,彻底解决文字、时间、光影等细节易出错的问题,引领行业进入精准生成新阶段。
唯一能完美清晰呈现文字的AI图像生成器,可创建4K产品图等
免费AI视频生成器,可将文字和图像转化为4K视频,无需编辑技能。
免费4K AI图像生成与编辑器,支持精确文字渲染,适用于多种设计。
Nano Banana 2是AI图像生成与编辑平台,用先进神经网络秒变文字为视觉作品。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
HyperX-Sentience
主宰者是由坎度AI研发的尖端文本生成图像模型,基于稳定扩散v1.5,能够根据文字描述生成高质量、细节丰富的图像。
fofr
一个基于FLUX.1-dev的LoRA模型,专门用于生成窗户上冷凝效果的文字图像
AlekseyCalvin
基于FLUX.1-dev模型的LoRA适配器,专门用于生成带有文字的新现实主义风格图像拼贴
Shakker-Labs
基于FLUX.1-dev训练的文字海报风格LoRA模型,用于生成具有艺术感的文字海报图像。
alimama-creative
基于SD3-medium微调的控制网修复模型,支持高分辨率图像修复和文字生成
stabilityai
一款多模态扩散变换器(MMDiT)文本生成图像模型,在图像质量、文字排版、复杂提示理解及资源效率方面均有显著提升
OEvortex
PixelGen是由HelpingAI开发的文本生成图像模型,能够根据文字描述生成高质量图像。
Gurveer05
BLIP 是一个基于 Transformer 的图像描述生成模型,已在 RSICD 数据集上进行了微调,能够为遥感图像生成准确的文字描述。
TencentARC
PhotoMaker是一个文本到图像生成模型,能够通过输入的人脸照片和文字提示快速生成定制化的照片或绘画作品,无需训练。
stets
这是一个用于SDXL1.0模型的LoRA适配器,专门用于生成带有诡异文字的任天堂64游戏卡带图像。
KappaNeuro
基于LoRA技术的文本生成图像扩散模型,擅长根据文字描述生成具有电影级色彩调色板的视觉作品
nnpy
这是一个基于 BLIP 架构的图像描述生成模型,能够为输入的图片生成简洁的文字描述。