Kling AI發佈2.6版本,新增原生音頻生成功能,支持中英雙語對白、歌唱與音效同步輸出,實現文本到視頻的完整創作流程,標誌着AI視頻進入有聲時代。
阿里巴巴通義實驗室開源Z-Image-Turbo-Fun-Controlnet-Union模型,擴展Z-Image系列圖像生成生態。該模型強化了精確控制與創意生成能力,已在Hugging Face上線,採用Apache2.0許可,支持商用。
阿里通義發佈生圖模型Z-Image,首日登頂Hugging Face趨勢榜,下載量達50萬次。該模型僅6億參數,卻能媲美大型模型,精細還原皮膚、髮絲、光影和紋理,構圖氛圍出色。同時推出優化版Z-Image-Turbo,僅需8步即可生成高質量圖像。
阿里巴巴開源Z-Image圖像模型,支持中英雙語文字渲染,僅6B參數實現高效圖像生成與編輯,視覺質量優秀。該模型由通義實驗室開發,聚焦AI技術趨勢,助力開發者洞悉創新應用。
基於 AI 的在線圖像生成與編輯工具。
Z-Image Turbo是高效AI圖像生成模型,秒速生成高質量圖像。
Alibaba
-
輸入tokens/百萬
輸出tokens/百萬
上下文長度
$2
Stepfun
Minimax
drbaph
Z-Image(造相)是一個擁有60億參數的高效圖像生成基礎模型,專門解決圖像生成領域的效率和質量問題。其蒸餾版本Z-Image-Turbo僅需8次函數評估就能達到或超越領先競品,在企業級H800 GPU上可實現亞秒級推理延遲,並能在16G VRAM的消費級設備上運行。
T5B
Z-Image-Turbo 是經過 FP8 E5M2 和 E4M3FN 格式量化的圖像處理模型,基於原始 Tongyi-MAI/Z-Image-Turbo 模型優化,在保持性能的同時顯著減少模型大小和推理資源需求。
Tongyi-MAI
Z-Image是一款功能強大且高效的圖像生成模型,擁有60億參數。它能有效解決圖像生成領域在效率、質量和功能多樣性方面的問題,為用戶提供高質量的圖像生成和編輯服務。