AI视频企业爱诗科技与港股上市公司中国儒意达成深度战略合作,获1420万美元战略投资。双方将在影视视觉设计、视效制作、智能生成宣传素材及流媒体资产优化等领域合作,中国儒意还将开放版权资源,助力爱诗科技释放IP创作潜力。
完美世界宣布新增“AI应用(AIGC)”概念,其游戏研发已深度整合AI绘图技术,显著提升美术设计效率与创意产出。该技术广泛应用于角色原画、场景构建、道具设计等环节,能基于文本或草图自动生成高质量视觉素材,加速概念设计迭代,并为美术团队提供创作灵感与参考。
清华大学TSAIL实验室与生数科技联合开源视频生成加速框架TurboDiffusion,将AI视频扩散模型的推理速度提升100至200倍,视觉质量几乎无损。该技术针对现有开源模型进行深度优化,在单张RTX 5090显卡上实现从分钟级到秒级的实时生成,标志着AI视频创作进入新时代。
火山引擎发布多项AI更新,豆包视觉模型升级,Seedream4.5增强图像创作功能,Seedance1.5Pro推出视频生成模型,加速企业AI普惠。
新一代AI视觉创作引擎,可创作多类型专业级视觉内容。
Visboom是电商时尚领域AI视觉创作平台,降本增效
Seedream 4.5可创建4K视觉效果,支持多语言文本,适用于专业创作。
Nano Banana Pro是强大的上下文感知AI图像编辑器,用简单文本提示创作惊艳视觉效果。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$2
$20
-
$8
$240
52
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
duyntnet
Chroma 是一个高质量的文本到图像生成模型,专注于生成逼真的图像内容。该模型采用先进的扩散技术,能够根据文本描述生成高质量的视觉内容,特别适合本地部署环境下的图像创作需求。
fotographerai
ZenCtrl是一个自动化个性化视觉内容创作流程的智能体,能够执行多种设计任务和训练自用模型。
Coobiw
基于InternLM2开发的视觉语言大模型,具备卓越的图文理解与创作能力
HuggingFaceM4
Idefics2 是一个开放的多模态模型,能够接受任意序列的图像和文本输入并生成文本输出。该模型可以回答关于图像的问题、描述视觉内容、基于多张图像创作故事,或仅作为纯语言模型使用。
internlm
基于InternLM2的视觉-语言大模型,具备卓越的图文理解与创作能力
书生·浦语2是基于InternLM2的视觉语言大模型(VLLM),具备先进的图文理解与创作能力。
基于InternLM2的视觉语言大模型,具备卓越的图文理解与创作能力
InternLM-XComposer2是基于InternLM2研发的视觉-语言大模型,具备卓越的图文理解与创作能力。
JCTN
Super Cereal - SDXL LoRA是一个基于Stable Diffusion XL的文本到图像转换模型,专门针对创意内容创作场景进行了优化。该模型能够根据特定的文本提示词生成独特的视觉图像,无需复杂的触发词即可产生良好的效果。
yuanzheng
基于稳定扩散技术的文本生成图像模型,专注于商业级视觉内容创作。