ComfyUI-GGUF es un proyecto que proporciona soporte de cuantificación GGUF para los modelos nativos de ComfyUI. Permite almacenar los archivos de modelos en formato GGUF, un formato promovido por llama.cpp. Aunque los modelos UNET convencionales (conv2d) no son adecuados para la cuantificación, los modelos transformer/DiT como flux parecen verse menos afectados. Esto permite ejecutarlos en GPU de gama baja con una tasa de bits por peso menor.