Anthropicは最近、初の「混合推論モデル」であるClaude3.7Sonnetを発表しました。これは、より複雑な問題を解決し、数学やコーディングなどの分野で以前のモデルを凌駕することを目指しています。同時に、Anthropicは「代理」コーディングツールであるClaude Codeの「限定研究プレビュー版」も発表しました。このツールは、開発者のワークフローにおいて重要な役割を果たす積極的な協力者としての位置づけです。

Claude2、Anthropic、人工知能、チャットボット クロード

次世代推論モデル、大幅な性能向上

Claude3.7Sonnetの発表は、Anthropicが推論モデル分野で重要な一歩を踏み出したことを示しています。この新しいモデルは、数学計算やコーディングタスクにおいて特に優れたパフォーマンスを発揮し、特に代理コーディング、金融、法律タスクにおけるパフォーマンスは以前のバージョンよりも大幅に向上しています。前身であるClaude3.5Sonnetと比較して、3.7バージョンでは推論能力が著しく向上しています。Claudeはまだリアルタイムのウェブ検索をサポートしていませんが、知識は2024年10月まで更新されているため、より現実的な回答を提供できます。

このモデルは来週月曜日からClaudeアプリケーションで利用可能になり、開発者はAnthropicのAPI、Amazon Bedrock、Google CloudのVertex AIを通じて使用することもできます。実行コストは以前のバージョンと同じで、入力トークン100万トークンあたり3ドル、出力トークン100万トークンあたり15ドルです。

Claude Code:AIコーディングの新たなパートナー

新しく発表されたClaude3.7Sonnetに加えて、Anthropicは「代理」コーディングツールであるClaude Codeの研究プレビュー版も発表しました。Claude Codeは開発者の強力なアシスタントとして設計されており、コードの検索と読み取り、ファイルの編集、テストの記述と実行、GitHubへのコードの提出を行うことができます。市場に出回っている他のAIコーディングツールと比較して、Claude Codeは協調性に重点を置いており、コードの作成を支援するだけでなく、開発者がコードベースを管理し、作業効率を向上させることも支援します。

製品副社長のMichael Gerstenhaber氏は、Claude Codeでは開発者がモデルのレジスタを調整してAIの思考方法を制御し、回答時間の制限を正確に指定できることを指摘しました。これは製品の意思決定において非常に重要です。

推論体験の簡素化、AI業界の発展を推進

今回の発表会で、Anthropicのプロダクトリサーチ責任者であるDianne Penn氏は、同社が推論体験を簡素化したいというビジョンを強調しました。彼女は、推論は独立したモジュールではなく、人工知能の本質的な特性であるべきだと述べています。Claudeの発表はこの考え方を反映しており、このモデルは簡単な質問に素早く答えるだけでなく、2週間のイタリア旅行の計画など、複雑な問題にも対応できます。

現在、Claude3.7Sonnetの技術は、ウェブサイトのデザイン、インタラクティブゲームの開発、テストセットの作成によるコーディング作業の実験など、Anthropic社内で広く活用されています。同社は、モデルのAPIをコントローラー方式にマッピングすることで、古典的なポケモンゲームでの能力をテストし、Claude3.7バージョンは以前のモデルをはるかに上回るパフォーマンスを発揮し、複数のジムリーダーを打ち負かしました。

競争激化、Anthropicは優位に立つ可能性

人工知能技術の急速な発展に伴い、Claude3.7Sonnetの発表は、AnthropicがOpenAIなどの競合他社との技術競争において再び優位に立ったことを示しています。業界では、推論モデルのパフォーマンスが向上するにつれて、AI業界は「万能型」モデルの未来に向かって進んでいると広く考えられています。これは、将来のAIが単なる独立した推論ツールではなく、多機能な総合的な協調プラットフォームになることを意味します。