螞蟻集團和inclusionAI聯合推Ming-Omni:首個開源版多模態GPT-4o
近日,Inclusion AI 與 螞蟻集團聯合推出了一款名爲 “Ming-Omni” 的先進多模態模型,標誌着智能技術的新突破。Ming-Omni 能夠處理圖像、文本、音頻及視頻,爲多種應用提供強大支持,其功能不僅涵蓋語音和圖像生成,還具備多模態輸入的融合處理能力。** 全面的多模態處理能力 **Ming-Omni 的設計中採用了專用編碼器來提取不同模態的標記(tokens),這些標記經過 “Ling” 模塊(即混合專家架構,MoE)進行處理,後者配備了新提議的模態特定路由器。這樣一來,Ming-Omni 便能夠高效地處理和融合多