OpenAIは先日、APIの新しいバージョンo1モデル「o1-2024-12-17」を発表しました。このバージョンでは、スマートファンクションコール、JSON形式の構造化出力のサポート、画像分析機能など、多くのエキサイティングな新機能が追加されています。
OpenAIのレポートによると、新しいモデルは、特に数学とプログラミングにおいて、多くのタスクでパフォーマンスが大幅に向上しています。新しくリリースされたo1モデルは、数学タスクの正確性が96.4%に達し、以前のバージョン「o1-preview」の85.5%から大幅に向上しています。
同様に、プログラミングタスクの正確性も52.3%から76.6%に向上しました。これらの向上は、開発者とユーザーが、特に複雑な問題を処理する場合、より正確で効率的な結果を得ることができることを意味し、正確性が大幅に向上しています。
正確性の向上に加えて、新しいモデルは推論タスク処理時のトークン使用量も約60%削減しました。これにより、モデルの実行速度が向上し、使用コストも削減され、開発者はこのモデルをより経済的に利用できます。
OpenAIは、ユーザーが新しいテクノロジーによる利便性を体験できるように、段階的にレベル5のAPIユーザーに新しいモデルを公開する予定です。
音声APIの大幅な値下げ
音声機能に関しては、OpenAIは重要な価格調整も行いました。音声入力トークンの料金は60%削減され、現在、100万トークンあたり40ドルです。出力トークンは80ドルです。一方、キャッシュされた音声入力の料金はさらに大幅に削減され、100万トークンあたり2.50ドルになりました。
さらに、OpenAIは、100万入力トークンあたり10ドル、出力トークンあたり20ドルという、より経済的なオプションであるGPT-4o miniも発表し、リアルタイム音声アプリケーションの開発を容易にしました。
新しいスタイルとファインチューニングオプション
OpenAIは、「プリファレンスファインチューニング」と呼ばれる新しい方法も導入しました。この方法は従来の教師ありファインチューニングとは異なり、ユーザーが異なる応答に対する好みを学習することにより、創造的なライティングや要約などの主観的なタスクにおけるモデルのパフォーマンスを向上させます。
さらに、OpenAIは開発者ツールを拡張し、GoとJava向けの新しいソフトウェア開発キット(SDK)を発表し、開発者の使いやすさをさらに向上させました。
これらの新機能は段階的に開発者に公開され、OpenAIはまずレベル5のユーザーに詳細なドキュメントを提供し、これらの新機能をより良く理解し、活用できるようにします。
要点:
📊 新しいo1モデルは、数学とプログラミングのタスクにおける正確性がそれぞれ96.4%と76.6%に向上しました。
💰 OpenAIの音声機能は大幅に値下げされ、音声入力トークンは100万あたり40ドル、出力トークンは100万あたり80ドルになりました。
🛠️ 新しい「プリファレンスファインチューニング」方法とGo、Java SDKにより、開発者はカスタマイズ機能を向上させることができます。