開源雙語文生圖生成模型
IDEA-CCNL
Taiyi-Diffusion-XL是一個專注於增強中文文生圖生成能力的同時保留英文理解能力的雙語擴散模型。基於Stable-Diffusion-XL架構,通過高質量雙語數據集訓練,在圖像質量、多樣性和文本對齊方面表現出色,為AIGC和數字藝術創作提供新的選擇。
一個專注於將圖像內容轉換為文本描述的模型,支持中文處理。
首個開源的中文Stable Diffusion動漫模型,基於100萬篩選過的動漫中文圖文對訓練
首個開源的中英雙語Stable Diffusion模型,基於0.2億篩選過的中文圖文對訓練
首個開源的中文Stable Diffusion模型,基於0.2億篩選過的中文圖文對訓練
首個開源的中文CLIP模型,基於1.23億圖文對進行預訓練,文本編碼器採用RoBERTa-base架構。
首個開源的中文CLIP模型,基於1.23億圖文對進行預訓練,文本編碼器採用RoBERTa-large架構。
首個開源的中文CLIP模型,基於1.23億圖文對預訓練,支持中文圖文特徵提取和零樣本分類
基於RoBERTa-base架構的特殊預訓練英文版多模態文本編碼器,採用100萬圖文對進行訓練
基於COCO和Visual Genome數據集進行特殊預訓練的英文版MAP視覺編碼器,採用ViT-base架構