Pruna es un framework de optimización de modelos diseñado para desarrolladores. Mediante una serie de algoritmos de compresión, como cuantificación, poda y compilación, hace que los modelos de aprendizaje automático sean más rápidos, más pequeños y con un coste computacional menor durante la inferencia. El producto es compatible con varios tipos de modelos, incluidos LLMs y transformadores visuales, y admite varias plataformas, como Linux, MacOS y Windows. Pruna también ofrece Pruna Pro, una versión empresarial que desbloquea funciones de optimización avanzadas y soporte prioritario para ayudar a los usuarios a mejorar la eficiencia en aplicaciones reales.