["加州大学圣克鲁斯分校研发 MiniGPT-5 模型,实现了文本和图像的有效对齐。","MiniGPT-5 采用了多模态编码器和 Generative Vokens 技术,生成连贯、高质量的文本和图像。","模型在多个数据集上的测试中表现优于对比基线,展现出强大的适应能力。"]
用于生成图像与语言的多模态模型