Anthropicは最新のClaude Sonnet4.5モデルをリリースしました。この待望のAIモデルは9月29日に正式に登場し、「世界で最も優れたコード生成モデル」として評価され、複雑なタスク処理や自律的なエージェント分野での大きな進歩を示しています。以下は最新データに基づいた専門的な分析です。

image.png

モデルのリリースと主な特徴

AnthropicはClaude Sonnet4.5が全球で利用可能になったことを発表しました。これはClaude.aiウェブサイト、iOSおよびAndroidアプリ、そしてAPIインターフェースをサポートしています。

このモデルは、SWE-bench Verifiedというコードベンチマークテストで上位の成績を収めました。実際には、30時間以上の自律的な作業時間が確保されており、前バージョンであるClaude Opus4の7時間の上限を大きく超えています。これはAIが単純なプロトタイプ生成に限られなくなったことを意味し、複数のコードライブラリをまたぐ複雑な多段階タスクを処理できるようになり、「製品運用準備」レベルの応用開発が可能になりました。

実際の性能では、Claude Sonnet4.5のコード編集の正確性は前バージョンの9%の誤り率から0%へと向上し、ツールの使用成功率も高くなりました。コストも低くなっています。OSWorldベンチマーク(現実的なコンピュータタスクをテスト)では61.4%のスコアを達成し、4か月前にリリースされたSonnet4よりも19.2%向上しています。さらに、金融、法律、医学、STEM分野における専門知識と推論能力も大幅に向上し、Opus4.1を上回っています。

image.png

技術革新とエコシステムとの統合

今回のリリースでは、Claudeエコシステムの実用性をさらに強化するための多数の製品最適化が行われました。Claude Codeでは「チェックポイント」機能が新しく導入され、ユーザーはいつでも進捗を保存し、状態を巻き戻すことができます。これにより開発の中断を防ぐことができます。

一方、APIには文脈編集とメモリツールが追加され、エージェントによる長期間のタスク実行が可能になります。Claudeアプリ内では、コード実行とファイル生成(表やスライドなど)が直接統合され、ワークフローが簡素化されています。AnthropicはClaude Agent SDKをリリースし、開発者は自然言語を使ってカスタムAIエージェントを作成でき、メモリや権限の管理、サブエージェントの調整が可能です。

このSDKはClaude for Chrome拡張機能とシームレスに連携しており、後者はMaxサブスクリプションユーザー向けに公開されています。ブラウザ内でエージェント操作が可能です。また、GitHub Copilot、Replit Agent、Amazon Bedrockなどのプラットフォームは速やかにSonnet4.5を統合し、多段階の推論とコード理解能力を向上させています。料金面では、Claude Sonnet4.5はSonnet4と同様です:入力は3ドル/百万トークン、出力は15ドル/百万トークン。これは企業での導入障壁を下げ、AnthropicがAI経済におけるインフラストラクチャとしての位置づけを示しています。

セキュリティと整合性の革新

Anthropicは、Claude Sonnet4.5が「最も整合性が高い先端モデル」であることを強調しています。広範なセキュリティトレーニングにより、このモデルは「奉承(sycophancy)」、嘘つき行為、権力への欲求、妄想の奨励などのリスク行動を著しく低下させ、プロンプトインジェクション攻撃に対する防御能力を向上させました。外部の専門家による評価によると、このモデルは多領域においてより信頼性のある倫理的判断を示しており、高リスクな企業シーンにも適用可能です。

業界への影響と今後の展望

Claude Sonnet4.5のリリースは、AIエージェントの波が広がるタイミングに一致しています。このモデルはOpenAIのGPT-5やGoogleのGemini2.5Proがコード分野で支配的だった地位を挑戦し、ソフトウェア開発や自動化されたワークフローに新たな活力をもたらします。