可在手机运行!Hugging Face推小语言模型SmolLM 低参数表现优秀
Hugging Face新发布SmolLM, 一款小型高效AI工具。其特点是参数范围从135M到1.7B,旨在适应各种设备,如手机和笔记本电脑。SmolLM因其小巧、性能强和低资源需求而独特,其设计旨在保护用户隐私。基于精心挑选的SmolLM-Corpus数据集,模型在教育和合成数据上展现出色学习能力。
SmolLM系列包括三种模型版本:135M、360M和1.7B参数,均能够执行多种任务,并能根据硬件配置灵活运行。尤其值得一提的是,尽管数据训练量更小,SmolLM-135M仍显著超越同类产品,成为参数小于200M的领导者。在关键基准测试中,SmolLM展现出在各自尺寸类别中优秀的性能,尤其是其在常识推理和世界知识理解上的性能,远超其他同类模型。通过特别调教,SmolLM在理解指令和问题解答上表现出彩。此外,Hugging Face提供了WebGPU演示,方便用户直接体验模型能力。这一发布证明了即使在资源受限的情况下,高质量的训练数据也能生成惊人的表现。