OpenAI gibt heute die Einführung seines neuen Flaggschiff-Modells GPT-4o mini auf Azure AI bekannt. Es unterstützt die Textverarbeitung und wird zukünftig auch Bild-, Audio- und Videofunktionen bieten.

image.png

GPT-4o mini ist deutlich intelligenter als GPT-3.5 Turbo – im MMLU-Benchmark (Mass Multitask Language Understanding) erreicht es 82% im Vergleich zu 70% bei GPT-3.5 Turbo – und ist über 60% günstiger.¹ Das Modell bietet ein erweitertes Kontextfenster von 128K und integriert die verbesserten mehrsprachigen Funktionen von GPT-4o. GPT-4o mini kann kostenlos im Azure OpenAI Studio Playground getestet werden.

Microsoft Azure AI bietet GPT-4o mini standardmäßige Sicherheitsfunktionen, erweiterte Datenresidenz und verbesserte Dienstverfügbarkeit. Kunden können eine verbesserte Leistung und Funktionalität auf Azure AI erwarten, insbesondere in Streaming-Szenarien wie Assistenten, Code-Interpretern und Retrieval.

Azure AI kündigt für GPT-4o mini ein globales Pay-as-you-go-Modell mit maximaler Durchsatzbeschränkung an. Kunden können jetzt flexibel nach Verbrauch bezahlen, während der Datenverkehr weltweit geroutet wird, um einen höheren Durchsatz zu gewährleisten. Gleichzeitig wird die statische Steuerung des Speicherorts der Daten ermöglicht. Die globale Pay-as-you-go-Bereitstellungsoption bietet einen Durchsatz von 15 Millionen Tokens pro Minute (TPM) und eine Verfügbarkeit von 99,99% für GPT-4o mini, gleichwertig mit den branchenüblichen Raten von OpenAI.

GPT-4o mini wird noch in diesem Monat auf Azure AI verfügbar sein und im Batch-Dienst angeboten werden. Batch liefert Hochdurchsatz-Jobs innerhalb von 24 Stunden mit einem Rabatt von 50% durch die Nutzung von Nicht-Spitzenlastkapazitäten. Dies ist nur möglich, weil Microsoft Azure AI betreibt und so Nicht-Spitzenlastkapazitäten an Kunden weitergeben kann.

Microsoft Azure AI wird ebenfalls diesen Monat die Feinabstimmungsfunktion für GPT-4o mini veröffentlichen, damit Kunden das Modell an spezifische Anwendungsfälle und Szenarien anpassen können. Nach der Aktualisierung der tokenbasierten Abrechnung für das Training im letzten Monat, hat Microsoft Azure AI die Hosting-Gebühren um 43% gesenkt. Zusammen mit den niedrigen Inferenzpreisen macht dies die Feinabstimmung der Azure OpenAI Services zur kostengünstigsten Lösung für Kunden mit Produktions-Workloads.

Wichtigste Punkte:

⭐ GPT-4o mini kommt auf Azure AI, unterstützt Textverarbeitung, ist extrem schnell und bietet umfassende Funktionen.

⭐ Das neue Modell ist intelligenter als seine Vorgänger, über 60% günstiger und bietet ein größeres Kontextfenster sowie mehrsprachige Funktionen.

⭐ Azure AI bietet für GPT-4o mini eine globale Pay-as-you-go-Bereitstellungsoption mit hohem Durchsatz und 99,99% Verfügbarkeit.