OpenAI推出GDPval基准测试,评估AI模型与人类专业人士的表现差异。GPT-5和Claude Opus4.1在某些领域已接近专家水平,但不会立即取代人类工作。企业高管对AI潜力持乐观态度,但实际应用仍需时间。