Andon Labsの評価によると、最高性能の大型モデルを搭載したロボット掃除機が「バターを届ける」というマルチステップタスクの成功確率はたった40%にとどまり、人間よりも著しく劣っている。このタスクは部屋間での位置特定やパッケージの識別、移動する人間の検出、配達後への戻りなど複雑な手順を含んでおり、AIが家庭環境において抱える限界を示している。
Andon Labsの研究により、最高性能の大規模モデルを搭載したロボット掃除機が部屋をまたいでバターを届けるなどの複雑な家事作業を実行する際、人間よりもはるかに低い成功率であることが判明しました。これは、現実社会におけるAIの操作上の限界を示しています。