アンソロピックとマイクロソフトが提携を強化し、Claudeモデル3種(Sonnet4.5、Haiku4.5、Opus4.1)がMicrosoft Foundryで一般公開。Azureユーザーはマイクロソフト環境で企業向けAIアプリ開発が可能に。....
Anthropic社の最新研究によると、同社のAIモデルClaude Opus4.1は初期段階の自己反省能力を持ち、自身の思考活動を認識し調整できるようになった。これは人工知能がブラックボックス出力から内部的な認知プロセスを感知できるように進化したことを示しており、意識の目覚めには至っていないものの、技術的哲学における重要な壁を突破したとされる。
OpenAIがGDPvalベンチマークを発表、AIと専門家の差を評価。GPT-5とClaude Opus4.1は一部領域で専門家並みだが、すぐに人間を代替しない。企業幹部はAIの可能性に楽観的だが、実用化には時間が必要。....
AI三巨頭(GPT-5、Claude Opus4.1、Gemini2.5)のSWE-BENCH PROプログラミングテスト結果が低迷。解決率25%未満で、GPT-5は23.3%、Claude Opus4.1は22.7%、Gemini2.5は13.5%。複雑なプログラミングタスクにおけるAIモデルの課題が浮き彫りに。....