テキストから画像生成が盛り上がっている!智譜のオープンソース画像生成モデルCogView3、SDXLより10倍高速!
先日、智譜AIは最新の成果であるCogView3とそのアップグレード版CogView-3Plus-3Bを一般公開し、テキストから画像生成の分野に新たな活力を注ぎ込みました。CogView3の登場は重要なマイルストーンと言えるでしょう。テキストから画像生成分野で中継拡散を実装した最初のモデルとして、独自の級聯拡散手法を採用しています。この革新的なアプローチは、まず低解像度の画像を生成し、その後、中継に基づく超解像技術を用いて最終出力を完成させます。これにより、大幅な速度向上を達成しています。