アリババがZ-Image画像モデルを開源し、中国語と英語の両言語をサポートし、わずか6Bパラメータで効率的な画像生成と編集が可能で、視覚的品質が優れている。このモデルは通義研究所が開発し、AI技術のトレンドに焦点を当て、開発者が革新的な応用を理解するお手伝いをしている。
アリババの通義実験室がZ-Image-Turboを発表。6Bパラメータで20B+モデル並みの性能を実現。RTX4090で1024×1024画像を2.3秒生成、VRAM使用量13GB。8ステップで印刷品質を達成し、3060 6Gなど民生GPUにも対応(最大16GB)。複雑な中国語プロンプトを正確に理解。....
アリババがZ-Image画像生成モデルをオープンソース化しました。わずか6Bパラメータで効率的な生成と編集が可能で、視覚的品質は20Bレベルの商業モデルに近いです。このモデルは単一ストリームのDiTアーキテクチャを使用しており、生成速度が速く、リソース消費が少ないため、AI画像ツールの一般消費者向けアプリケーションの普及が期待されます。