开源双语文生图生成模型
IDEA-CCNL
Taiyi-Diffusion-XL是一个专注于增强中文文生图生成能力的同时保留英文理解能力的双语扩散模型。基于Stable-Diffusion-XL架构,通过高质量双语数据集训练,在图像质量、多样性和文本对齐方面表现出色,为AIGC和数字艺术创作提供新的选择。
一个专注于将图像内容转换为文本描述的模型,支持中文处理。
首个开源的中文Stable Diffusion动漫模型,基于100万筛选过的动漫中文图文对训练
首个开源的中英双语Stable Diffusion模型,基于0.2亿筛选过的中文图文对训练
首个开源的中文Stable Diffusion模型,基于0.2亿筛选过的中文图文对训练
首个开源的中文CLIP模型,基于1.23亿图文对进行预训练,文本编码器采用RoBERTa-base架构。
首个开源的中文CLIP模型,基于1.23亿图文对进行预训练,文本编码器采用RoBERTa-large架构。
首个开源的中文CLIP模型,基于1.23亿图文对预训练,支持中文图文特征提取和零样本分类
基于RoBERTa-base架构的特殊预训练英文版多模态文本编码器,采用100万图文对进行训练
基于COCO和Visual Genome数据集进行特殊预训练的英文版MAP视觉编码器,采用ViT-base架构