Während die künstliche Intelligenz die globale Technologiebranche erfasst, bereitet sich ein „Veteran“ auf seine Rückkehr auf die Bühne vor. IBM hat kürzlich einen 28-seitigen Bericht mit dem Titel „Mainframes als treibende Kraft der digitalen Transformation“ veröffentlicht, um zu beweisen, dass diese 60 Jahre alte Computerplattform auch im Zeitalter der KI unverzichtbar ist. Der vom IBM Institute for Business Value verfasste Bericht zeigt nicht nur den aktuellen Stand der Mainframes, sondern beschreibt auch ihre Schlüsselrolle bei der KI-gesteuerten digitalen Transformation.

Der Bericht zeigt, dass 79 % der IT-Führungskräfte Mainframes für die Realisierung KI-getriebener Innovationen als entscheidend ansehen. Nach 60 Jahren Entwicklung sind Mainframes zu einer tragenden Säule für die Speicherung und Verarbeitung riesiger Mengen geschäftskritischer Daten geworden. Mit dem Beginn der KI-getriebenen digitalen Transformation in Unternehmen werden Mainframes eine Schlüsselrolle bei der Wertsteigerung von Daten spielen.

Serverraum Rechenzentrum (1)Server

Bildquelle: Das Bild wurde mit KI generiert, Bildrechte liegen bei Midjourney.

IBM scheint besorgt zu sein, dass Mainframe-Benutzer moderne generative KI-Workloads möglicherweise nur für Public Clouds und/oder x86- und GPU-Server in Rechenzentren geeignet halten. Daher hebt der Bericht die Bedeutung von Mainframes in diesem Bereich hervor. IBM schlägt einen hybriden Ansatz vor, der Mainframes, Public Clouds und Edge Computing kombiniert, um die jeweils am besten geeignete Plattform je nach Workload-Charakteristika auszuwählen.

Der Bericht empfiehlt Mainframe-Benutzern, „KI für transaktionsinterne Einblicke zu nutzen, um Geschäftsanwendungsfälle wie Betrugserkennung, Geldwäschebekämpfung, Kreditentscheidungen, Produktempfehlungen, dynamische Preisgestaltung und Sentimentanalyse zu verbessern“. Ein bemerkenswertes Beispiel ist eine nordamerikanische Bank, die durch die Migration ihrer Kreditkartentransaktionsbewertungs-Anwendung auf einen Mainframe die Verarbeitungskapazität von 20 % der Transaktionen mit 80 Millisekunden pro Transaktion auf 15.000 Transaktionen mit 2 Millisekunden pro Transaktion erhöhte und so eine 100%ige Transaktionsbewertung erreichte. Dies führte zu jährlichen Einsparungen von etwa 20 Millionen US-Dollar bei der Betrugsprävention.

IBM betont, dass Mainframes mit integrierten On-Chip-KI-Beschleunigern „auf Millionen von Inferenzanfragen pro Sekunde skaliert werden können, mit extrem geringer Latenz, was besonders wichtig für transaktionsbasierte KI-Anwendungsfälle (wie die Erkennung von Zahlungsbetrug) ist“. IBM schlägt einen Ansatz der „integrierten KI“ vor, der bestehende Machine-Learning-Modelle mit neuen Large Language Models (LLMs) kombiniert, um die Genauigkeit der Vorhersagen zu verbessern.

Neben Geschäftsanwendungen kann KI auch zur Verbesserung des Mainframe-Managements eingesetzt werden. Der Bericht ergab, dass 74 % der Führungskräfte die Integration von KI in den Mainframe-Betrieb und die Veränderung der Art und Weise, wie Systeme verwaltet und gewartet werden, als entscheidend ansehen. KI-gestützte Automatisierung, prädiktive Analysen, Selbstreparatur- und Selbstoptimierungsfunktionen können Probleme proaktiv erkennen und verhindern, Arbeitsabläufe optimieren und die Systemzuverlässigkeit verbessern.

Im Bereich Sicherheit können Mainframes KI zur Überwachung, Analyse, Erkennung und Reaktion auf Cyberbedrohungen nutzen. Darüber hinaus können generative KI und Code-Assistenten die Konvertierung alter Programmiersprachen (wie COBOL) in Java und die JCL-Entwicklung beschleunigen und „die Lücke bei den Mainframe-Kenntnissen schließen, indem Entwicklern ermöglicht wird, Anwendungen schneller und effizienter zu modernisieren oder zu erstellen“.

IBM setzt für seine nächste Generation von z16-Mainframes (voraussichtlich 2025 erhältlich) eine Methode zur Auslagerung der KI-Verarbeitung ein und stattet sie mit dedizierten KI-Datenverarbeitungseinheiten (DPUs) aus. Die neue Mainframe-Generation wird mit bis zu 32 Telum II-Prozessoren ausgestattet sein, die über On-Chip-KI-Inferenzbeschleunigung mit einer Geschwindigkeit von 24 TOPS verfügen. Der Spyre-Beschleuniger wird 32 zusätzliche KI-Beschleunigerkerne und 1 GB DRAM hinzufügen, mit einer Leistung, die der der On-Chip-KI-Beschleunigung von Telum II entspricht.

IBM erwähnt jedoch keine Pläne, GPUs zu seiner Mainframe-Architektur hinzuzufügen. Inferenz-Workloads werden auf Mainframes effizient ausgeführt, KI-Trainings-Workloads jedoch nicht. Wir können erwarten, dass IBM Vektorisierungs- und Vektor-Datenbankfunktionen für Mainframes bereitstellt, um die Retrieval-Augmented Generation (RAG) in Inferenz-Workloads zu unterstützen.

Für diesen Kommentator wäre das Hinzufügen von GPUs zu Mainframes ein „heiliger Gral“, da dies die Tür für die Ausführung von KI-Trainings-Workloads auf dieser klassischen Großrechnerplattform öffnen würde. Vielleicht wird diese Idee, nämlich ein GPU-Koprozessor, ein Merkmal der z17-Mainframe-Generation sein.