推論AIモデルのベンチマークテスト費用が急増:1つの評価に3000ドル近くかかる場合も
第三者AIテスト機関であるArtificial Analysisのデータによると、OpenAIのo1推論モデルを7つの一般的なベンチマークテストで評価するのに2,767.05ドルかかりましたが、同社の非推論モデルであるGPT-4oではわずか108.85ドルでした。この顕著な違いは、AI評価の持続可能性と透明性に関する議論を引き起こしています。段階的に問題解決を思考できるAIシステムである推論モデルは、特定の分野では優れた性能を発揮しますが、そのベンチマークテスト費用は従来のモデルよりもはるかに高額です。Arti