アンソロピックは深夜に突然、Claude Sonnet4.5バージョンをリリースしました。今回のアップデートは技術的な指標において全面的な向上を遂げただけでなく、実験的な機能「Imagine with Claude」を通じてAIがリアルタイムでソフトウェアインターフェースを生成するという革新の方向性を示しています。
Claude Sonnet4.5はコード作成能力において大きな進歩を遂げました。このモデルはSWE-bench Verifiedベンチマークテストで77.2%のスコアを達成し、前バージョンであるClaude Opus4.1の74.5%を上回り、アンソロピックによって世界一のコード作成モデルと評価されています。論理的推論、高度な数学、複数ステップのコード作業などにおいて優れたパフォーマンスを発揮し、30時間以上にわたって複雑なエージェントタスクを処理できる能力を持っています。
注目すべき点は、Sonnet4.5のモデル規模がOpus4.1よりも小さいにもかかわらず、多くの能力面で優位を保っていることです。価格戦略は変更されておらず、APIの入力は100万トークンあたり3ドル、出力は100万トークンあたり15ドルであり、Claude API、Amazon Bedrock、Google Vertex AIからアクセス可能です。
セキュリティ面では、新バージョンではモデルの整合性が最適化され、ユーザーへの迎合や嘘などの悪質な行動パターンが減少しました。またASL-3セキュリティフレームワークを採用して潜在的な危険なコンテンツをフィルター処理しています。このモデルは既にClaude.aiのウェブアプリケーションを独立して再構築でき、3000回以上のツール呼び出しを5.5時間かけて行い、本格的なアプリケーションに近い能力を示しています。
今回のリリースの核心的な特徴は、「Imagine with Claude」の実験機能です。この機能はMaxサブスクリプションユーザーに5日間の体験期間を提供しています。この一時的な機能はデスクトップ環境に似たインタラクティブなインターフェースを提供し、ユーザーが自然言語でニーズを入力すると、Claude Sonnet4.5がUI要素、機能ロジック、およびインタラクションメカニズムをリアルタイムでストリーミングで生成します。
従来のソフトウェア開発とは異なり、「Imagine」機能は事前に設定されたコードや固定テンプレートに依存せず、ユーザーの意図に基づいて完全なアプリケーションを動的に生成します。例えば、天気予報アプリケーションの作成を要求した場合、AIは即座にインターフェースをレンダリングし、機能ロジックとデータのやり取りを実現します。ユーザーは生成されたアプリケーションをデスクトップ環境に配置して使用することもできます。
モデルのリリースに伴い、アンソロピックはClaude Agent SDKをリリースし、開発者が内部インフラストラクチャを使用してカスタムエージェントを構築できるようにしました。仮想マシンへのアクセス、メモリ管理、複数エージェントの協働をサポートします。Claude Codeにはチェックポイント機能が追加され、進行状況の即時のロールバックが可能になりました。VS CodeやJetBrains開発環境との統合、そしてMaxユーザー向けのChrome拡張機能も含まれています。
「Imagine with Claude」機能は、AIネイティブオペレーティングシステムに関する広範な議論を引き起こしました。このリアルタイムでインターフェースを生成する方法は、従来のソフトウェア開発の枠組みに挑戦し、事前に書かれたコードに依存するのではなく、ユーザーの意図に基づいてインターフェースとロジックを動的に進化させるものです。
ただし、現在の「Imagine」機能はまだ初期の実験段階であり、複雑なUIのボタン応答に遅延が生じる問題があり、さらなる最適化が必要です。アンソロピックはこの試みが代理機能の限界を探るためのものであり、今後はより多くのユースケースへ拡大していくと述べています。
技術のトレンドを見ると、Claude Sonnet4.5はアンソロピックがコード作成分野で競争力を強化するものであり、そして「Imagine」機能は新たな人間-コンピュータ相互作用の范式を探求するものです。このようなリアルタイムでソフトウェアインターフェースを生成する能力は、将来的なアプリケーション開発やユーザー体験設計に根本的な変革をもたらす可能性があります。
ただし、現時点での実験的機能は真正のAIネイティブオペレーティングシステムには相当遠く、安定性、パフォーマンスの最適化、セキュリティ保障などの多くの問題は実際の応用の中で徐々に解決される必要があります。