Kürzlich führte das Forschungsteam von Microsoft eine Gegenüberstellung zwischen API-Proxy und GUI-Proxy durch und stellte fest, dass beide Proxys unterschiedliche Vorzüge aufweisen und je nach Bedarf sinnvoll ausgewählt werden können. Während API-Proxys über programmierbare Schnittstellen mit der Software interagieren, simuliert der GUI-Proxy menschenähnliches Verhalten, indem er Buttons anklickt und Menüs durchläuft, um Aufgaben abzuschließen. Wenn beispielsweise ein Termin geplant werden soll, kann der API-Proxy dies mit einem Funktionsaufruf erledigen, während der GUI-Proxy dazu nötigen würde, die Kalenderanwendung zu öffnen und Schritt für Schritt Informationen einzugeben.
In ihrer Untersuchung bewertete das Microsoft-Team die Leistung dieser beiden Proxys in neun Kategorien. Ein wesentlicher Unterschied lag in der Art und Weise, wie sie mit der Software interagierten: API-Proxys nutzen Funktionsaufrufe und sind daher tendenziell stabiler und mit einem geringeren Fehlerrisiko ausgestattet. GUI-Proxys hingegen sind von der visuellen Benutzeroberfläche abhängig, was zwar weniger effizient ist, dafür aber mehr Flexibilität bietet. GUI-Proxys können praktisch alle Softwareprogramme steuern, die eine sichtbare Benutzeroberfläche besitzen, selbst wenn diese keine API bereitstellt.
Die Studie betonte auch, dass API-Proxys im Hinblick auf Sicherheit und Wartbarkeit Vorteile bieten, da auf Funktionsbasis Zugriffsberechtigungen eingeschränkt werden können und sie von Versionskontrollsystemen profitieren. GUI-Proxys hingegen sind anfälliger für kleinste visuelle Änderungen, die zu Ausfällen führen können. Allerdings sind GUI-Proxys transparenter, sodass Nutzer jedes einzelne Vorgehen deutlich sehen können, was die Prüfung erleichtert.
Microsoft schlug drei Hybridstrategien vor, um API-Proxys mit GUI-Proxys zu kombinieren. Erstens wird durch die Verwendung von APIs GUI-Aktionen versteckt, zum Beispiel durch die Vereinfachung eines mehrstufigen Prozesses zur Generierung von Finanzberichten zu einer einfachen Funktion „GenerateReport()“. Die zweite Strategie verwendet Orchestrierungstools, um die Schritte von API und GUI abzustimmen, was sich insbesondere bei Datenbankabfragen und Kreditprüfungen als nützlich erwiesen hat. Die dritte Strategie ist die Nutzung von Low-Code und No-Code-Plattformen, die es nicht-technischen Benutzern ermöglichen, Automatisierungsvorgänge durch Ziehen und Platzieren zu erstellen.
Beim Auswahlentscheid für den geeigneten Proxy lieferte das Forscherteam klare Richtlinien. API-Proxys sind ideal für anspruchsvolle Aufgaben mit hoher Performance, insbesondere wenn es um Schnittstellen mit guter Dokumentation geht. GUI-Proxys sind hingegen besser geeignet für ältere Systeme ohne API sowie für mobile Anwendungen. Mit der Zeit kann das Hybrid-System neue auftauchende APIs anpassen und so größere Flexibilität bieten.
Hier sind die Hauptpunkte zusammengefasst:
🌟 API-Proxys erreichen schnelle und stabile Aufgabenabschluss durch Funktionsaufrufe und sind für sicherheitskritische Umgebungen geeignet.
🔄 GUI-Proxys zeichnen sich durch hohe Flexibilität aus und können visuelle Änderungen anpassen, ideale Lösung für alte Systeme und Aufgaben, bei denen visuelle Bestätigungen notwendig sind.
🤝 Hybridsysteme kombinieren die Vorteile beider Seiten und können je nach spezifischer Anforderung die optimale Lösung auswählen, um die Automatisierung voranzubringen.