最先端AIモデルでも複雑な旅行計画には対応困難、OpenAI o1-previewも苦戦
最近の新たな研究によると、OpenAIの最新のo1-previewのような高度なAI言語モデルでさえ、複雑な計画タスクでは苦戦することが示されました。この研究は、復旦大学、カーネギーメロン大学、バイトダンス、オハイオ州立大学の科学者らによって共同で行われ、BlocksWorldとTravelPlannerという2つの計画ベンチマークにおけるAIモデルのパフォーマンスをテストしました。BlocksWorldは古典的な計画…