QwQ-32B-Preview-gptqmodel-4bit-vortex-v3
Il s'agit d'une version quantifiée sur 4 bits du modèle Qwen2.5-32B, conçue pour une inférence efficace et un déploiement nécessitant peu de ressources.
QwQ-32B-Preview-gptqmodel-4bit-vortex-v3 Dernière situation du trafic
Nombre total de visites mensuelles
25296546
Taux de rebond
43.31%
Nombre moyen de pages par visite
5.8
Durée moyenne de la visite
00:04:45