テンセント混元DiT、6GB少メモリ版と混元Captionerを正式オープンソース化
テンセントが最新アップグレードした混元文画像生成大規模モデル(混元DiT)1.2バージョンは、Onijza、LoRA、ControlNet、KohyaプラグインをDiffusersライブラリに適合させ、パーソナライズされた画像生成モデルのトレーニングにおけるハードルを大幅に削減しました。このアップグレード版では、画像の質感と構図が大幅に向上しており、中国語と英語の両言語に対応した混元Captionerモデルは、中国語の意味をより正確に理解し、構造化され、完全で正確な画像説明を生成します。混元Captionerモデルのオープンソース化により、