Anthropic与微软深化合作,三款Claude模型(Sonnet4.5、Haiku4.5、Opus4.1)正式登陆Microsoft Foundry平台并开放公测。Azure客户现可通过该平台调用先进AI模型开发企业级应用与智能代理,充分融合微软生态优势。核心价值在于企业能在熟悉的微软环境中便捷部署Claude系列模型。
Anthropic公司最新研究显示,其AI模型Claude Opus4.1已具备初步自省能力,能识别并调控自身思维活动。这标志着人工智能从"黑箱"输出向可感知内部认知过程迈进,虽未达到意识觉醒,但突破了技术哲学的重要门槛。
OpenAI推出GDPval基准测试,评估AI模型与人类专业人士的表现差异。GPT-5和Claude Opus4.1在某些领域已接近专家水平,但不会立即取代人类工作。企业高管对AI潜力持乐观态度,但实际应用仍需时间。
AI三大巨头GPT-5、Claude Opus4.1和Gemini2.5在Scale AI的SWE-BENCH PRO编程测评中表现惨淡,无一突破25%解决率。GPT-5仅23.3%,Claude Opus4.1为22.7%,Gemini2.5低至13.5%。这一结果重创行业信心,凸显顶级AI模型在复杂编程任务上的严重不足。