Meta发布超轻量Llama模型 在手机 AI 竞赛中击败谷歌和苹果
Meta Platforms今日发布其Llama模型的全新精简版本,包括Llama3.21B和3B两款产品,首次实现了大规模语言模型在普通智能手机和平板电脑上的稳定运行。通过创新性地整合量化训练技术与优化算法,新版本在保持原有处理质量的同时,将文件体积缩减56%,运行内存需求降低41%,处理速度更是提升至原版4倍,单次可连续处理8,000字符文本。在 Android 手机上进行测试时,Meta 的压缩 AI 模型(SpinQuant 和 QLoRA)与标准版本相比,速度和效率都有显著提升。较小的模型运行速度提高了四倍,而内存占用却