OpenAI推出GDPval基準測試,評估AI模型與人類專業人士的表現差異。GPT-5和Claude Opus4.1在某些領域已接近專家水平,但不會立即取代人類工作。企業高管對AI潛力持樂觀態度,但實際應用仍需時間。