SAMURAI es un modelo de seguimiento de objetos visuales basado en Segment Anything Model 2 (SAM 2), diseñado específicamente para tareas de seguimiento visual de objetos que se mueven rápidamente o se autoocultan. Al incorporar pistas de movimiento temporal y un mecanismo de selección de memoria de percepción del movimiento, predice eficazmente el movimiento del objeto y optimiza la selección de la máscara, logrando un seguimiento robusto y preciso sin necesidad de reentrenamiento o ajuste fino. SAMURAI puede funcionar en tiempo real y muestra un potente rendimiento de cero disparos en varios conjuntos de datos de referencia, demostrando su capacidad de generalización sin necesidad de ajuste fino. En las evaluaciones, SAMURAI ha logrado una mejora significativa en la tasa de éxito y la precisión en comparación con los rastreadores existentes, por ejemplo, una mejora del 7,1% en el AUC en LaSOT-ext y una mejora del 3,5% en el AO en GOT-10k. Además, en comparación con los métodos de supervisión completa en LaSOT, SAMURAI también muestra competitividad, destacando su robustez en escenarios de seguimiento complejos y su potencial valor de aplicación práctica en entornos dinámicos.