OpenAI埋め込みモデルは、2つの新しい埋め込みモデルと、GPT-4 Turboプレビューモデル、GPT-3.5 Turboモデル、テキストコンテンツモデレーションモデルのアップデートを含む、一連の新型埋め込みモデルです。デフォルトでは、OpenAI APIに送信されたデータは、OpenAIモデルのトレーニングや改善には使用されません。新しい埋め込みモデルは、より小型で効率的なtext-embedding-3-smallモデルと、より大規模で強力なtext-embedding-3-largeモデルを含み、価格が引き下げられています。埋め込みとは、自然言語やコードなどのコンテンツ内の概念を表す数値の集合です。埋め込みにより、機械学習モデルやその他のアルゴリズムは、コンテンツ間の関係をより容易に理解し、クラスタリングや検索などのタスクを実行できるようになります。これらは、ChatGPTやAssistants APIにおける知識検索、そして多くの検索拡張生成(RAG)開発ツールを支えています。text-embedding-3-smallは、新しい効率的な埋め込みモデルであり、先行モデルであるtext-embedding-ada-002モデルと比較して性能が向上しています。MIRACLの平均スコアは31.4%から44.0%に、英語タスク(MTEB)の平均スコアは61.0%から62.3%に上昇しました。text-embedding-3-smallの価格は、以前のtext-embedding-ada-002モデルと比べて5分の1に削減され、1,000トークンあたりの価格が$0.0001から$0.00002になりました。text-embedding-3-largeは、最大3072次元の埋め込みを作成できる、新世代の大規模埋め込みモデルです。性能は向上し、MIRACLの平均スコアは31.4%から54.9%に、MTEBの平均スコアは61.0%から64.6%に上昇しました。text-embedding-3-largeの価格は$0.00013/1,000トークンです。さらに、開発者がパフォーマンスとコストのバランスを取れるように、埋め込みの短縮機能をネイティブにサポートしています。