O nasa-smd-ibm-st é um modelo de transformação de sentenças baseado em Bi-encoder, treinado por meio de ajuste fino do modelo codificador nasa-smd-ibm-v0.1. Foi treinado com 271 milhões de amostras e 2,6 milhões de amostras específicas do domínio provenientes de documentos de direcionamento de missões científicas da NASA (SMD). O modelo visa aprimorar técnicas de linguagem natural, como recuperação de informações e pesquisa inteligente, para aplicações em tarefas de processamento de linguagem natural do SMD. Este modelo pode ser amplamente utilizado em casos de uso científicos relacionados à NASA SMD, como recuperação de informações e busca de semelhança de sentenças.