SmolVLM ist ein kleines, aber leistungsstarkes visuelles Sprachmodell (VLM) mit 2 Milliarden Parametern. Es zeichnet sich durch geringen Speicherbedarf und hohe Effizienz aus und ist damit führend in seiner Klasse. SmolVLM ist vollständig quelloffen, einschließlich aller Modell-Checkpoints, VLM-Datasets, Trainingsrezepte und Tools, die unter der Apache 2.0 Lizenz veröffentlicht werden. Das Modell eignet sich für die lokale Bereitstellung in Browsern oder Edge-Geräten, senkt die Inferenzkosten und ermöglicht benutzerdefinierte Anpassungen.