Hugging Face發佈SmolLM2:小型語言模型挑戰行業巨頭
Hugging Face今天發佈了SmolLM2,一組新的緊湊型語言模型,實現了令人印象深刻的性能,同時所需的計算資源比大型模型少得多。新模型採用Apache2.0許可發佈,有三種大小——135M、360M和1.7B參數——適合部署在智能手機和其他處理能力和內存有限的邊緣設備上。SmolLM2-1B模型在幾個關鍵基準測試中優於Meta的Llama1B模型,尤其是在科學推理和常識任務中表現出色。該模型在大多數認知基準上的表現都優於大型競爭模型,使用了包括FineWeb-Edu和專門的數學和編碼數據集在內的多樣化數據集組合。SmolL