Kürzlich hat der Bericht „State of Business AI 2025“ des Massachusetts Institute of Technology (MIT) Aufmerksamkeit erregt. Der Bericht zeigt auf, dass über 30 Milliarden Dollar in generative KI (GenAI) investiert wurden, aber bis zu 95 % der Pilotprojekte von Unternehmen nicht in die Produktion übergehen konnten.

Die Umfrage ergab, dass das Problem nicht die Technologie selbst oder die dazugehörigen Vorschriften ist, sondern vielmehr die Art und Weise, wie diese Werkzeuge angewendet werden. Viele Systeme sind nicht in die tatsächlichen Arbeitsabläufe integriert, fehlen an Gedächtnis und Anpassungsfähigkeit und verbessern sich nach einer gewissen Zeit selten. Daher funktionieren sie zwar in Laboren gut, aber in der Praxis kaum.

Roboter liest ein Buch

Bildquelle: Das Bild wurde von AI erstellt, der Bildlizenzierungsanbieter ist Midjourney

Der Begriff „GenAI-Abstand“ im Bericht ist auffällig. Einerseits brachten nur etwa 5 % der Pilotprojekte beachtliche Erfolge und generierten Millionen Dollar Umsatz; andererseits blieben fast alle anderen Projekte mit 90 % an der Testphase hängen. Die Forscher vom MIT stellten fest, dass dieser Unterschied nicht darin besteht, ob man das beste Modell oder die schnellsten Rechenchips besitzt, sondern vielmehr mit der tatsächlichen Anwendung der Werkzeuge zusammenhängt. Erfolgreiche Beispiele sind solche Systeme, die eng mit realen Arbeitsabläufen verbunden sind und sich mit der Zeit verbessern, während gescheiterte Projekte versuchen, allgemeine KI in schwere Prozesse einzubauen.

Obwohl allgemeine Tools wie ChatGPT und Copilot von mehr als 80 % der Unternehmen ausprobiert wurden und beinahe 40 % der Unternehmen sie in irgendeinem Maße implementiert haben, steigern diese Werkzeuge hauptsächlich die individuelle Produktivität und wirken sich nicht signifikant auf den Gewinn der Unternehmen aus. Etwa 60 % der Unternehmen erkundeten Plattformen oder Systeme, die für Unternehmen speziell angepasst wurden, aber nur 20 % der Projekte erreichten den Pilotstadium. Die Hauptursachen für den Misserfolg waren fragile Arbeitsabläufe, fehlende Lernfähigkeit der Tools und eine Unpassung zum tatsächlichen Arbeiten der Menschen.

Der Bericht analysierte außerdem vier Hauptmuster, einschließlich begrenzter Branchendisruption, Unternehmensparadoxon, Investitionsbias und Implementierungsvorteil. Dabei stellte sich heraus, dass große Unternehmen zwar die meisten Pilotprojekte starteten, aber oft am langsamsten Fortschritte machten; während mittelständische Unternehmen in etwa 90 Tagen von der Testphase in die Umsetzung wechseln können. Der MIT stellte zudem fest, dass etwa 70 % des Budgets in Vertrieb und Marketing fließen, obwohl die Rückgabelöwen bei der Automatisierung im Hintergrund oft höher sein könnten.

Einige Kritiker bezweifeln die Transparenz des Berichts und behaupten, dass der Erfolgsgrad von 95 % nicht ausreichend durch Daten unterstützt wird. Zudem sei die Definition von Erfolg und Misserfolg umstritten und könnte dazu führen, dass einige Projektergebnisse unterschätzt werden. Außerdem löste die Verbindung des Berichts mit kommerziellen Institutionen Diskussionen aus, da dies möglicherweise die Objektivität der Forschung beeinflusste.

In Zukunft wird sich der Bericht auf „intelligente Agenten-KI“ konzentrieren. Diese Werkzeuge können lernen, sich merken und zwischen verschiedenen Lieferanten koordinieren, was ein neues „Netzwerk intelligenter Agenten“ ermöglichen wird. Dieses Netzwerk soll eine großflächige und konsistente Anwendung ermöglichen, was frühere GenAI-Projekte nie erreicht haben.

Wichtiger Punkt:  

📉 95 % der GenAI-Projekte von Unternehmen gelangen nicht in die Produktion, hauptsächlich aufgrund der Anwendung der Werkzeuge.  

🏢 Große Unternehmen starten zwar die meisten Pilotprojekte, sind jedoch meist am langsamsten bei der Umsetzung; mittelständische Unternehmen wechseln in der Regel schneller zur Umsetzung.  

🤖 Die Zukunft wird sich auf intelligente Agenten-KI konzentrieren und auf effizientere Arbeitsabläufe und Konsistenz hoffen.