SapiensビジョンモデルはMeta Reality Labsによって開発され、2Dポーズ推定、ボディパーツセグメンテーション、深度推定、サーフェス法線予測など、人間の視覚タスクの処理に特化しています。3億枚を超える人間の画像でトレーニングされており、高解像度画像処理能力を備え、データが不足している状況でも優れたパフォーマンスを発揮します。シンプルで拡張性に優れ、パラメータ増加による性能向上も顕著で、複数のテストにおいて既存の基線モデルを上回っています。