Kürzlich hat Microsoft eine neue Prompt Orchestration Markup Language (POML) eingeführt, die speziell für die Prompt-Engineering von großen Sprachmodellen (LLMs) entwickelt wurde. Laut Informationen, die von AIbase zusammengefasst wurden, zielt POML darauf ab, Probleme im traditionellen Prompt-Entwicklungsprozess zu lösen, indem sie eine strukturierte und wartbare Methode zur Verbesserung der Effizienz bei der Entwicklung von KI-Anwendungen bietet. Allerdings wird in der Community debattiert, ob diese neue Sprache nur eine „Neuauflage“ von XML ist und ob ihre Komplexität die Praxistauglichkeit beeinträchtigen könnte.

Wichtige Funktionen von POML: Strukturiertes Prompt-Engineering  

POML verwendet eine Syntax, die an HTML erinnert, und zerlegt komplexe Prompts in modulare Teile durch semantische Komponenten wie `<role>`, `<task>` und `<example>`, wodurch die Lesbarkeit, Wiederverwendbarkeit und Wartbarkeit der Prompts verbessert wird. Microsoft gibt an, dass POML Probleme wie das Fehlen einer Struktur, die Komplexität der Datenintegration, die Empfindlichkeit gegenüber Formatierungen und das Fehlen von Werkzeugunterstützung löst. Entwickler können mit POML die Prompt-Komponenten systematisch organisieren, verschiedene Datentypen (wie Text, Tabellen oder Bilder) leicht einbinden und mithilfe eines CSS-ähnlichen Stilsystems die Ausgabestruktur flexibel anpassen, um Instabilitäten des Modells aufgrund von Formatänderungen zu reduzieren.

Microsoft präsentiert eine neue Markupsprache für KI – POML: Prompt Orchestration Markup Language Ehrlich gesagt, was ist der Unterschied zu XML? (siehe.jpg

Starke Werkzeugunterstützung: VS Code-Erweiterung und SDK  

POML ist nicht nur eine Markupsprache, sondern verfügt auch über eine leistungsstarke Entwicklungswerkzeug-Ökosystem. Die Visual Studio Code-Erweiterung bietet Funktionen wie Syntax-Hervorhebung, kontextsensitiven Auto-Vervollständigung, Echtzeitvorschau und Fehlerdiagnose, was die Entwicklererfahrung deutlich verbessert. Darüber hinaus unterstützt POML SDKs für Node.js und Python, um den Prompt-Engineering-Prozess nahtlos in bestehende Arbeitsabläufe und LLM-Frameworks zu integrieren. Zum Beispiel kann ein einfaches POML-Beispiel mithilfe des `<img>-Komponenten` ein Bild referenzieren und mit `<task>` und `<output-format>` die Aufgabe und die Anforderungen an die Ausgabe definieren, um schnell strukturierte Prompts zu generieren.

Reaktion der Community: Innovation oder „Neuauflage von XML“?  

Obwohl die Veröffentlichung von POML Aufmerksamkeit erregte, sind die Bewertungen der Community gemischt. Einige Entwickler loben die strukturierte Gestaltung von POML und sind der Ansicht, dass ihre modulare Methode und der Template-Engine (mit Variablen, Schleifen und Bedingungsausdrücken) die Entwicklung komplexer Prompts vereinfachen können. Andere Stimmen hingegen zweifeln an der Ähnlichkeit von POML mit XML und glauben, dass seine komplexe Syntax die Prompt-Engineering-Praxis zu „Code-Schreiben“ machen könnte und somit den Lernaufwand erhöhen könnte. Einige Entwickler geben sogar zu, dass mit dem Fortschritt von Agentic AI und Tool-Aufrufen die Empfindlichkeit der LLMs gegenüber Formatierungen abgenommen habe und die Notwendigkeit von POML daher fragwürdig sei.

Anwendungsfälle und zukünftiges Potenzial  

POML zeigt Potenzial in Szenarien wie dynamischer Inhaltsgenerierung, A/B-Tests von Prompt-Formaten und der Generierung von Multimodal-Anweisungen. Beispielsweise können Entwickler mit POML einen Prompt-Vorlagetemplate erstellen, der Tabellendaten enthält und automatisch Verkaufsberichte generiert; oder durch Wechsel der Stylesheets schnell verschiedene Ausgabestile testen. Microsoft betont, dass die dekupplierte Architektur von POML (Trennung von Inhalt und Darstellung) es ermöglicht, sich an verschiedene LLM-Modelle anzupassen und die Robustheit der Anwendungen zu erhöhen. In Zukunft könnte POML, mit der Entwicklung der Open-Source-Community und der Verbesserung der Tools, zu einem wichtigen Standard im Bereich des Prompt-Enginings werden.