AI市場の競争が激化する中、OpenAIは最近、Flex処理と呼ばれる新しいAPIをリリースしました。この新しいオプションにより、ユーザーはコストを抑えてAIモデルを使用できるようになりますが、応答速度と可用性はやや低下します。Flex処理は、モデル評価、データエンリッチメント、非同期ワークロードなど、優先順位が低く、非生産的なタスクをサポートすることを目的としています。

具体的には、Flex処理のコストは大幅に削減されています。例えば、o3モデルを使用する場合、Flex処理の価格は100万トークンあたり5ドルで、標準価格の10ドルから50%削減されています。出力についても、100万トークンあたりの費用は40ドルから20ドルに削減されています。o4-miniモデルの場合、Flex処理の100万トークンあたりの入力コストはわずか0.55ドル、出力コストは2.20ドルで、標準価格を大幅に下回っています。

image.png

OpenAIがFlex処理をリリースした時期は、AIサービスのコストが全体的に上昇し、競合他社もよりコストパフォーマンスの高い製品を次々とリリースしている時期と重なります。例えば、Googleが最近リリースしたGemini 2.5 Flashモデルは、DeepSeek R1と同等の性能を持ち、入力トークンコストにおいても優位性があります。これは、効率的で低コストなAIソリューションへの需要が高まっていることを示しています。

Flex価格の発表の中で、OpenAIはAPIの適切な使用を確保するために、開発者はo3モデルにアクセスするために新しく導入された認証プロセスを経る必要があると述べています。この措置は、不正使用を防ぎ、プラットフォーム全体のセキュリティを維持することを目的としています。

Flex処理の導入により、OpenAIは、特に予算が限られているがAI技術を活用したいと考えている開発者にとって、経済的な選択肢を提供しています。技術の進歩と市場の変化に伴い、AIサービスがより身近になり、より多くのユーザーに受け入れられるようになると期待できます。