Kling AIがバージョン2.6をリリース。新たにネイティブ音声生成機能を追加し、中英二か国語の対話・歌唱・効果音の同期出力をサポート。テキストから動画までの完全な創作フローを実現し、AI動画が音声時代に入ったことを示す。....
アリババ・タオイー研究所がZ-Image-Turbo-Fun-Controlnet-Unionモデルをオープンソースとして公開しました。Z-Imageシリーズの画像生成エコシステムを拡張しています。このモデルは正確な制御と創造的な生成能力を強化しており、Hugging Faceで公開されています。Apache2.0ライセンスを使用し、商用利用が可能です。
阿里通義が発表した画像生成モデル「Z-Image」がHugging Faceトレンド1位を獲得、初日ダウンロード数50万回。6億パラメータで大型モデル並みの高品質な肌・髪・光影・質感を再現。同時に高速版「Z-Image-Turbo」も公開、8ステップで高画質画像を生成可能。....
アリババの通義実験室がZ-Image-Turboを発表。6Bパラメータで20B+モデル並みの性能を実現。RTX4090で1024×1024画像を2.3秒生成、VRAM使用量13GB。8ステップで印刷品質を達成し、3060 6Gなど民生GPUにも対応(最大16GB)。複雑な中国語プロンプトを正確に理解。....
drbaph
Z-Image(造相)は60億のパラメータを持つ高効率な画像生成基礎モデルで、画像生成分野の効率と品質の問題を専門的に解決します。その蒸留バージョンであるZ-Image-Turboは、たった8回の関数評価でリーディングな競合モデルに匹敵するか、それを上回る性能を発揮し、企業用のH800 GPUでは亚秒級の推論遅延を実現し、16G VRAMの消費者向けデバイスでも動作します。
T5B
Z-Image-Turboは、FP8 E5M2とE4M3FN形式で量子化された画像処理モデルで、元のTongyi-MAI/Z-Image-Turboモデルを最適化し、性能を維持しながらモデルサイズと推論リソースの要件を大幅に削減します。
Tongyi-MAI
Z-Imageは機能が豊富で高効率な画像生成モデルで、60億のパラメータを持っています。これは画像生成分野における効率、品質、機能の多様性の問題を効果的に解決し、ユーザーに高品質の画像生成と編集サービスを提供します。