字节发布14B参数多模态神器BAGEL,碾压Qwen2.5-VL,图像生成媲美SD3
字节跳动Seed团队在Hugging Face平台重磅发布BAGEL,一款基于混合专家(MoE)架构的开源多模态基础模型,拥有14亿总参数和7亿活跃参数。BAGEL在数万亿token的交错多模态数据集上预训练,性能超越Qwen2.5-VL和InternVL-2.5,图像生成质量媲美SD3,并支持复杂推理任务如自由图像编辑、未来帧预测和3D生成,引发全球AI社区热议。AIbase综合最新社交媒体动态,深入解析BAGEL的技术亮点及其对多模态AI领域的革命性影响。项目地址:https://github.com/bytedance-seed/BAGELBAGEL:多模态理解与生成的统一标杆BAGEL(ByteD