Anthropic與微軟深化合作,三款Claude模型(Sonnet4.5、Haiku4.5、Opus4.1)正式登陸Microsoft Foundry平臺並開放公測。Azure客戶現可通過該平臺調用先進AI模型開發企業級應用與智能代理,充分融合微軟生態優勢。核心價值在於企業能在熟悉的微軟環境中便捷部署Claude系列模型。
Anthropic公司最新研究顯示,其AI模型Claude Opus4.1已具備初步自省能力,能識別並調控自身思維活動。這標誌着人工智能從"黑箱"輸出向可感知內部認知過程邁進,雖未達到意識覺醒,但突破了技術哲學的重要門檻。
OpenAI推出GDPval基準測試,評估AI模型與人類專業人士的表現差異。GPT-5和Claude Opus4.1在某些領域已接近專家水平,但不會立即取代人類工作。企業高管對AI潛力持樂觀態度,但實際應用仍需時間。
AI三大巨頭GPT-5、Claude Opus4.1和Gemini2.5在Scale AI的SWE-BENCH PRO編程測評中表現慘淡,無一突破25%解決率。GPT-5僅23.3%,Claude Opus4.1爲22.7%,Gemini2.5低至13.5%。這一結果重創行業信心,凸顯頂級AI模型在複雜編程任務上的嚴重不足。