HawkEye ist ein leistungsstarkes Toolkit zur Überwachung, Beobachtbarkeit und Fehlersuche in Machine-Learning-Workflows innerhalb von Meta. Es unterstützt Empfehlungs- und Ranking-Modelle für zahlreiche Meta-Produkte. In den letzten zwei Jahren hat es zu einer erheblichen Verbesserung der Zeitdauer bei der Behebung von Produktionsproblemen geführt. HawkEye umfasst die Infrastruktur zur kontinuierlichen Erfassung von Daten aus Diensten und Trainingsmodellen sowie zur Datengenerierung, und Komponenten zur Datengenerierung und -analyse zur Ursachenfindung. Es unterstützt UX-Workflows für die interaktive Exploration, Untersuchung und Einleitung von Abhilfemaßnahmen. Durch eine interaktive Explorationsschnittstelle basierend auf den notwendigen Komponenten ermöglicht HawkEye Nutzern die effiziente Untersuchung und Lösung von Problemen.