nasa-smd-ibm-st es un modelo de transformación de oraciones basado en Bi-encoder, entrenado mediante ajuste fino a partir del modelo codificador nasa-smd-ibm-v0.1. Fue entrenado con 271 millones de muestras y 2,6 millones de muestras específicas del dominio provenientes de documentos de la Dirección de Misiones Científicas (SMD) de la NASA. El modelo tiene como objetivo mejorar las técnicas de lenguaje natural, como la recuperación de información y la búsqueda inteligente, para su aplicación en tareas de procesamiento de lenguaje natural de la SMD. Este modelo se puede utilizar ampliamente en casos de uso científicos relacionados con la NASA SMD, como la recuperación de información y la búsqueda de similitud de oraciones.