OpenAIの音声APIの大進化:数字の転写がより正確に、代理速度が40%も向上
OpenAIは2つのAPI更新を発表し、AIエージェントの音声インタラクションおよび複雑なタスクにおけるパフォーマンスを向上させました。新しく登場したリアルタイムモデル「gpt-realtime-1.5」と対応する音声モデルにより、音声コマンドの信頼性が大幅に向上しました。内部テストでは、新しいモデルが数字やアルファベットの転写精度を約10%向上させ、論理的な音声タスクの正確性は5%、指示実行の正確性は7%向上しています。