El campo de la segmentación de imágenes ha experimentado una transformación gracias a los avances en el aprendizaje profundo. Mask2Former, un modelo basado en Transformer, ha demostrado un rendimiento excepcional en tareas de segmentación semántica, de instancias y panorámica. Si bien su rendimiento es superior, presenta limitaciones en los FPS en dispositivos con recursos limitados.

Enlace al proyecto: https://debuggercafe.com/mask2former/