Am Montag veröffentlichte Amazon Nova Act, einen allgemeinen KI-Agenten, der Webbrowser steuern und einfache Aktionen selbstständig ausführen kann. Gleichzeitig wurde das Nova Act SDK veröffentlicht, mit dem Entwickler Prototypen von Agenten mithilfe von Nova Act erstellen können.
Nova Act wurde vom neuen AGI-Labor von Amazon in San Francisco entwickelt und wird Schlüsselfunktionen für das kommende Alexa+ (die verbesserte Version des Amazon-Sprachassistenten mit generativer KI) bereitstellen. Die aktuelle Version von Nova Act wird jedoch als „vorläufige Forschungsversion“ präsentiert, und Entwickler können über die Website nova.amazon.com auf das Nova Act-Toolkit zugreifen.
Dieses Produkt ist ein klares Zeichen von Amazons Bestreben, mit OpenAIs Operator und Anthropics Computer Use zu konkurrieren. Mehrere große Technologieunternehmen glauben, dass KI-Agenten, die im Internet für Benutzer navigieren können, den Nutzen aktueller KI-Chatbots erheblich verbessern werden. Obwohl Amazon in diesem Bereich kein Pionier ist, könnte seine Reichweite durch Alexa+ die größte sein.
Laut Amazon können Entwickler das Nova Act SDK verwenden, um grundlegende Aufgaben für Benutzer zu automatisieren, z. B. online Essen bestellen oder Reservierungen vornehmen. Das Toolkit unterstützt die Integration mehrerer Funktionen, sodass der KI-Agent durch Webseiten navigieren, Formulare ausfüllen oder Daten in einem Kalender auswählen kann.
Amazon behauptet, dass Nova Act in internen Tests seine Konkurrenten übertroffen hat. Bei der ScreenSpot Web Text-Bewertung erzielte Nova Act eine Punktzahl von 94 % und übertraf damit CUA von OpenAI (88 %) und Claude3.7Sonnet von Anthropic (90 %). Amazon verwendete jedoch keine gängigeren Benchmarks wie WebVoyager, um Nova Act zu bewerten.
Nova Act ist das erste öffentliche Produkt des AGI-Labors, das von den ehemaligen OpenAI-Forschern David Luan und Pieter Abbeel geleitet wird. Beide gründeten ihre eigenen KI-Startups – Luan gründete Adept und Abbeel war Mitbegründer von Covariant – und wurden letztes Jahr von Amazon eingestellt, um die Arbeit des Unternehmens an KI-Agenten zu leiten.
Luan erklärte gegenüber TechCrunch, dass er glaube, dass Agenten ein wichtiger Schritt zur Entwicklung superintelligenter KI-Systeme seien, wobei er AGI als „ein KI-System, das helfen kann, alles zu erledigen, was Menschen auf einem Computer tun“ definiert. Er sagte, das Ziel des Teams bei der Entwicklung des Nova Act SDK sei es, kurze Aufgaben zuverlässig zu automatisieren und es Entwicklern zu ermöglichen, genau zu definieren, wann menschliche Eingriffe im Workflow erforderlich sind.
Die größte Herausforderung, vor der KI-Agenten in ihren Anfängen stehen, ist die Zuverlässigkeit zwischen verschiedenen Bereichen. In Tests sind bestehende Systeme oft langsam, haben Schwierigkeiten, über längere Zeiträume autonom zu funktionieren, und neigen dazu, Fehler zu machen, die Menschen nicht machen würden. Der Markt wird bald sehen, ob Amazon diese Einschränkungen überwunden hat oder ob sein Agent auch die gleichen Probleme aufweist wie seine Konkurrenten.