字節發佈14B參數多模態神器BAGEL,碾壓Qwen2.5-VL,圖像生成媲美SD3
字節跳動Seed團隊在Hugging Face平臺重磅發佈BAGEL,一款基於混合專家(MoE)架構的開源多模態基礎模型,擁有14億總參數和7億活躍參數。BAGEL在數萬億token的交錯多模態數據集上預訓練,性能超越Qwen2.5-VL和InternVL-2.5,圖像生成質量媲美SD3,並支持複雜推理任務如自由圖像編輯、未來幀預測和3D生成,引發全球AI社區熱議。AIbase綜合最新社交媒體動態,深入解析BAGEL的技術亮點及其對多模態AI領域的革命性影響。項目地址:https://github.com/bytedance-seed/BAGELBAGEL:多模態理解與生成的統一標杆BAGEL(ByteD