グーグルのVeo-3モデルは現実的な手術動画を生成できるが、医療操作の理解に不足がある。テストでは、AIが手術画像から8秒先の進行を予測し、SurgVeo基準で50本の本物の手術動画を評価した。4人の外科医が評価に参加し、モデルが重要な医学的ステップで欠陥があることを発見した。