Eine neue Studie zeigt, dass KI-Modelle nach nur zwei Büchern mit feiner Abstimmung in der Lage sind, den Schreibstil berühmter Autoren zu imitieren, und Leser bevorzugen diese Werke sogar mehr als die von professionellen Nachahmern. Die Studie wurde von einem Forschungsteam der State University of New York und der Columbia Law School durchgeführt und umfasste den Schreibstil von 50 berühmten Autoren, darunter der Nobelpreisträgerin Han Kang und dem Booker-Preis-Sieger Salman Rushdie.

Markenrecht, Urheberrecht

In der Studie bewerteten 159 Teilnehmer, darunter 28 Schreibexperten und 131 Nicht-Experten, verschiedene Textabschnitte über das Crowdsourcing-Portal Prolific. Während des Bewertungsprozesses wussten die Teilnehmer nicht, ob die Texte von Menschen oder KI erstellt wurden. Die Studie verwendete zwei Hauptmethoden zur KI-Training: Kontext-Hinting und spezifische Autor-Feinabstimmung. Beim Kontext-Hinting nutzten die Forscher drei Haupt-KI-Systeme, GPT-4o, Claude3.5Sonnet und Gemini1.5Pro, und gaben gleiche Anweisungen und Beispieltexte zur Generierung. Bei der spezifischen Autor-Feinabstimmung unterstützte nur GPT-4o die erforderlichen API-Funktionen, daher kauften die Forscher digitale Bücher von 30 Autoren und trainierten für jeden Autor ein eigenes Modell.

Die Teilnehmer wurden gebeten, zwei Textabschnitte miteinander zu vergleichen und denjenigen auszuwählen, den sie für besser hielten. Bei der Stilbewertung sahen die Teilnehmer auch eine Passage des Originalautors. Die Ergebnisse der Studie zeigten, dass bei grundlegendem Kontext-Hinting die Experten eine klare Vorliebe für menschliche Texte hatten, während die Wahl der Nicht-Expert:innen relativ unklar war. Nach der Feinabstimmung tendierten die Experten jedoch stärker dazu, KI-generierte Texte im Stil zu wählen, wobei die Anzahl sich auf das Achtfache erhöhte; bei der Schreibqualität stieg der Anteil der KI-Texte auf das Zweifache. Moderne KI-Erkennungstools können bis zu 97 % der Standard-KI-Ausgaben erkennen, während die Erkennungsrate für feinabgestimmte Ausgaben nur 3 % beträgt.

Zudem zeigte die Studie, dass die Menge der Trainingsdaten keinen Einfluss auf das Ergebnis hatte. Selbst Autoren, die nur zwei Bücher veröffentlicht haben, konnten gut nachgeahmt werden. Die Annäherung der Bewertungskriterien zwischen Experten und Nicht-Expert:innen zeigt, dass die Qualität der feinabgestimmten KI-Texte allgemein anerkannt wird. Da professionelle Schreibkosten bis zu 25.000 US-Dollar betragen können, während die Kosten für das Training von KI nur etwa 81 US-Dollar betragen, ist der wirtschaftliche Vorteil erheblich.

Diese Studienergebnisse kommen gerade zu einem Zeitpunkt, an dem amerikanische Gerichte über die Frage verhandeln, wie KI urheberrechtlich geschützte Materialien erlangt und verwendet. Das Forschungsteam schlägt vor, dass für KI, die speziell bestimmte Autoren nachahmen, rechtliche Unterscheidungen vorgenommen werden sollten, möglicherweise müsste die Wiederholung des Stils einzelner Autoren verboten werden oder es müsste eine klare Kennzeichnung von KI-generierten Texten erfolgen.

Wichtige Punkte:  

📚 KI-Modelle können den Schreibstil berühmter Autoren nach nur zwei Büchern generieren.  

🧑‍🎓 Nach der Feinabstimmung hat sich die Vorliebe der Leser für KI-generierte Texte deutlich verbessert.  

⚖️ Die Studienergebnisse könnten die Debatte um Urheberrechtsgesetze und faire Nutzung in den USA beeinflussen.