谷歌Gemini3Pro图像生成模型上线两月生成超10亿张图片,支持本地编辑、镜头调整、光照控制等功能,可输出2K/4K多语言文本图像,显著提升创意控制能力。
生数科技发布Vidu Q2版本“生图全家桶”,集成参考生图、文生图与图像编辑三大功能。新版本上线首日使用量突破50万次,显示用户需求旺盛。Vidu Q2增强了图像生成控制力,支持精准指定画面位置、动作与构图,并输出4K画质。新增图像编辑功能包括局部重绘和材质替换,在国际评测中表现优异。
谷歌推出Nano Banana Pro图像生成模型,基于Gemini3技术,支持4K分辨率、14对象融合和5人身份一致性,新增联网搜索与双重水印。价格大幅上调:1080p/2K每张0.139美元,4K每张0.24美元,较前代涨3-6倍。功能亮点包括专业控制选项(如机位、光效)和默认生成6张高保真图片供选择。
Adobe在MAX大会上推出基于聊天的AI助手,覆盖Photoshop、Express和Firefly应用。用户可通过对话委派创意任务并获取分步指导。同时扩大对Google、OpenAI等第三方AI模型的支持,推动内容创作向开放智能化发展。
由OpenAI驱动,可生成和编辑4K图像,文本准确,编辑快速,有免费试用。
GPT Image 2:免费AI图像生成器与在线照片编辑器,4K文字转图像。
Kling 5.0 AI可从文本、图像生成4K电影级视频,具备角色一致性等特性
ltx-2.3可从文本或图像生成视频,输出1080p到4K,有Fast和Pro版
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
Baidu
128
$2
$20
Owen777
UltraFlux是一款基于Flux的扩散变换器,专门用于原生4K文本到图像生成。它通过数据、架构和损失的协同设计,能够在各种不同纵横比下保持一致的图像质量。
opocai
这是一个基于LoRA和Diffusers技术的文本到图像生成模型,使用特定触发词'Put it here'来生成高质量图像。该模型基于FLUX.1-Kontext-dev基础模型构建,支持自适应光线调整和4K高清画质输出。
Jonjew
基于XL 1.0+Flux1D+SD1.5基础模型训练的LoRA微调模型,专注于生成具有超高清4K电影级画质和极致细节的写实皮肤纹理风格图像。
Efficient-Large-Model
Sana是一个高效生成4K分辨率图像的文本生成图像框架,能够快速合成高分辨率、高质量且文本-图像对齐性强的图像,并可在笔记本电脑GPU上部署。
PixArt-alpha
PixArt-Σ是基于Transformer架构的潜在扩散模型,可直接通过文本提示生成高分辨率图像(最高4K)。
Banana Image MCP是一个基于MCP协议的AI图像生成服务器,让Claude等助手能够使用Google Gemini模型生成高质量图像,支持4K分辨率和智能模型选择。
一个基于Google Gemini模型的AI图像生成MCP服务器,支持智能模型选择(Flash快速生成和Pro高质量4K生成)、多种宽高比控制、文件管理和模板功能,提供生产级图像生成能力。