阿里通義Qwen團隊發佈新版Qwen3-Omni-Flash-2025-12-01,作爲新一代全模態大模型,能高效處理文本、圖像、音頻和視頻輸入,實現實時流式響應,生成文本與自然語音輸出。升級重點提升了音視頻交互體驗,增強了對音視頻指令的理解和執行能力,優化了口語化場景中的表現。
阿里巴巴發佈新一代全模態大模型Qwen3-Omni-Flash-2025-12-01,支持文本、圖像、音頻和視頻的無縫輸入,並能實時流式同步生成高質量文本與自然語音,語音自然度接近真人。該模型採用實時流式架構,支持119種文本語言交互。
Alibaba
$3.9
輸入tokens/百萬
$15.2
輸出tokens/百萬
64
上下文長度