Cursor 実測:長距離の自動化プログラミングタスクにおいて GPT-5.2 が Claude Opus 4.5 より優れている
Cursorチームのテストによると、GPT-5.2は複雑なWebブラウザなどの長期的なプログラミングタスクにおいて、Claude Opus 4.5よりも信頼性が高かった。テストにはHTML解析、CSSレイアウト、JavaScriptバーチャルマシンなどの基盤開発が含まれており、数百万行のコードが必要な「ロングラン」プロジェクトにおいてGPT-5.2がより優れた性能を発揮した。