Die Stanford University hat im Bereich der Künstlichen Intelligenz erneut einen bedeutenden Fortschritt erzielt. Ihr neu entwickeltes STORM&Co-STORM-System wurde Open Source veröffentlicht. Dieses System kann durch einfache Themeneingaben umfassend Informationen aus verschiedenen Quellen zusammenführen und hochwertige, lange Artikel generieren. Diese Innovation vermeidet nicht nur Informationslücken, sondern steigert auch die Effizienz und Qualität wissenschaftlichen Schreibens erheblich.

Die Kerntechnologie des STORM&Co-STORM-Systems umfasst die Unterstützung durch Bing Search und GPT-4o mini. Der STORM-Teil generiert iterativ Gliederungen, Absätze und Artikel durch mehrperspektivische Fragen und Antworten zwischen einem „LLM-Experten“ und einem „LLM-Moderator“. Co-STORM hingegen generiert durch den Dialog zwischen mehreren intelligenten Agenten interaktive, dynamische Mindmaps, um sicherzustellen, dass keine Informationsbedürfnisse des Benutzers übersehen werden.

image.png

Benutzer müssen lediglich ein englisches Thema eingeben, und das System generiert einen hochwertigen, langen Artikel, der Informationen aus verschiedenen Quellen integriert, ähnlich einem Wikipedia-Artikel. Bei der Nutzung von STORM können Benutzer frei zwischen dem STORM- und dem Co-STORM-Modus wählen. Nach Eingabe eines Themas erstellt STORM innerhalb von 3 Minuten einen strukturierten, hochwertigen Langtext.

Zusätzlich können Benutzer durch Klicken auf „See BrainSTORMing Process“ den Brainstorming-Prozess der verschiedenen LLM-Rollen einsehen. Im Bereich „Entdecken“ können Benutzer Artikel und Chat-Beispiele anderer Wissenschaftler einsehen. Eigene generierte Artikel und Chatverläufe finden sich in der Seitenleiste „Meine Bibliothek“.

image.png

Der automatisierte Schreibprozess von STORM gliedert sich in drei Phasen: Generierung von Fragen aus verschiedenen Perspektiven, Generierung und Verfeinerung der Gliederung und Generierung des vollständigen Textes. Das System prüft relevante Wikipedia-Artikel, um verschiedene Perspektiven zum Thema zu identifizieren. Anschließend simuliert es einen Dialog zwischen einem Wikipedia-Autoren und einem Experten, der auf zuverlässigen Online-Quellen basiert. Aus den aus verschiedenen Perspektiven gesammelten Dialoginhalten wird mithilfe des inhärenten Wissens des LLM eine sorgfältig ausgearbeitete Gliederung erstellt.

image.png

Obwohl STORM bei der Recherche zu einem gegebenen Thema verschiedene Perspektiven entdeckt, können die gesammelten Informationen immer noch zu den vorherrschenden Quellen im Internet tendieren und möglicherweise Werbeinformationen enthalten. Eine weitere Einschränkung der Forschung besteht darin, dass die Forscher, obwohl sie sich darauf konzentrierten, Wikipedia-ähnliche Artikel von Grund auf neu zu generieren, nur die Generierung frei formatierten Textes in Betracht gezogen haben. Hochwertige Wikipedia-Artikel, die von Menschen verfasst wurden, enthalten in der Regel strukturierte Daten und multimodale Informationen.

Co-STORM zielt darauf ab, das Problem von Informationslücken bei der Sammlung und Integration von Informationen zu verbessern, um die Lerneffizienz deutlich zu steigern. Durch die Zusammenarbeit mehrerer intelligenter Agenten im Dialog, dynamische Mindmaps und ein Modul zur Berichtserstellung unterstützt es Benutzer beim Verständnis und der Organisation von Informationen. Die Forscher führten eine menschliche Bewertung mit 20 Freiwilligen durch und verglichen Co-STORM mit herkömmlichen Suchmaschinen und RAG-Chatbots. Die Ergebnisse zeigten, dass Co-STORM die Tiefe und Breite der Informationen deutlich verbessert. 70 % der Benutzer bevorzugten Co-STORM und gaben an, dass es die kognitive Belastung deutlich reduziert.

Derzeit unterstützt STORM&Co-STORM nur die englische Sprache. Zukünftig ist eine Erweiterung auf mehrere Sprachen geplant. Die Open-Source-Veröffentlichung dieses Systems markiert eine bemerkenswerte Ära, in der der Zugriff auf Informationen vollständig an die individuellen Bedürfnisse angepasst werden kann, was das Lernen von allem ermöglicht.

论文地址:https://www.arxiv.org/pdf/2408.15232