Die Bildsegmentierung hat durch den Fortschritt im Bereich des Deep Learning eine Revolution erlebt. Mask2Former, ein Transformer-basiertes Modell, zeichnet sich durch herausragende Leistungen in semantischer, Instanz- und Panoramassegmentierung aus. Obwohl es leistungsstark ist, besteht auf ressourcenbeschränkten Geräten eine Einschränkung der FPS (Frames pro Sekunde).

Projektlink: https://debuggercafe.com/mask2former/