GenSAM es un método para la detección de objetos de camuflaje (COD) que utiliza la técnica de indicaciones encadenadas de pensamiento intermodal (CCTP) para comprender las indicaciones visuales y emplea indicaciones de texto universales para obtener indicaciones visuales fiables. Este método genera y optimiza automáticamente las indicaciones visuales durante la prueba mediante la generación progresiva de máscaras (PMG), sin necesidad de entrenamiento adicional, logrando una segmentación de objetivos de camuflaje eficiente y precisa.