nasa-smd-ibm-stは、Bi-encoderに基づく文章変換モデルであり、nasa-smd-ibm-v0.1エンコーダーモデルをファインチューニングして訓練されました。2億7100万件の訓練サンプルと、NASA科学ミッション部門(SMD)文書から取得した260万件のドメイン固有サンプルを用いて訓練されています。このモデルは、情報検索やインテリジェント検索などの自然言語処理技術を強化し、SMDの自然言語処理タスクに適用することを目的としています。情報検索、文章類似度検索など、NASA SMD関連の科学的なユースケースに幅広く活用できます。