Im heutigen Zeitalter des rasanten Fortschritts in der künstlichen Intelligenz (KI) bemühen sich Unternehmen mit Hochdruck um die Implementierung von KI-Technologien in ihre Produktionsprozesse, um eine höhere Kapitalrendite zu erzielen. Trotz der Verfügbarkeit fortschrittlicher KI-Modelle auf dem Markt sehen sich Teams bei der Implementierung jedoch zahlreichen Herausforderungen gegenüber.

image.png

Schätzungen von Peter Bendol-Samuel, CEO der Everest Group, zufolge scheitern 90 % der Pilotprojekte für generative KI an der Überführung in die Produktion. Gartner prognostiziert zudem, dass bis Ende 2025 viele generative KI-Projekte nach dem Proof-of-Concept aufgegeben werden.

Die größte Hürde unter diesen Herausforderungen stellt die Koordinierung dar. Teams verfügen oft nicht über ausreichende Ressourcen, um alle Aufgaben zu bewältigen, und sind daher auf starre und kostspielige Drittanbieter-APIs angewiesen. Um diese Lücke zu schließen, hat Simplismart AI kürzlich eine Finanzierung in Höhe von 7 Millionen US-Dollar erhalten und eine End-to-End-Plattform für Machine Learning Operations (MLOps) vorgestellt, die den gesamten Koordinierungsprozess von der Modelloptimierung bis zur Implementierung und Überwachung beschleunigen soll.

Im Vergleich zu anderen MLOps-Lösungen auf dem Markt zeichnet sich Simplismart durch seine personalisierte Software-Optimierungs-Inferenz-Engine aus. Diese Engine ermöglicht extrem schnelle Modellbereitstellung, deutlich verbesserte Leistung und geringere Kosten. Amitanshu Jain, Mitbegründer von Simplismart, berichtet, dass das Llama3.18B-Modell ohne Hardware-Optimierung einen Durchsatz von 501 Token pro Sekunde erreicht – weit mehr als andere Inferenz-Engines.

Bei der internen KI-Implementierung stehen Teams vor mehreren Engpässen, darunter der Zugriff auf Rechenleistung, die Optimierung der Modellleistung, die Skalierung der Infrastruktur und die Kosteneffizienz. Die Simplismart-Plattform standardisiert den gesamten Workflow, sodass Benutzer nach Bedarf hochoptimierte Open-Source-Modelle feinabstimmen, implementieren und überwachen können.

Benutzer können die gemeinsam genutzte Infrastruktur von Simplismart nutzen oder ihre eigenen Rechenressourcen einbringen und ihre Infrastruktur und Implementierung bequem konfigurieren. Ein intuitives Dashboard ermöglicht die Einstellung von Parametern wie GPU, Maschinentyp und Skalierung. Die Plattform bietet außerdem Überwachungsfunktionen zur Nachverfolgung von Service Level Agreements (SLAs) und zur Überwachung der tatsächlichen Modellleistung.

Derzeit arbeitet Simplismart mit 30 Unternehmenskunden zusammen und plant, seine MLOps-Plattform weiter zu verbessern. Das Unternehmen möchte die neue Finanzierungsrunde für die Forschung und Entwicklung nutzen, um die KI-Inferenzgeschwindigkeit zu erhöhen und den Jahresumsatz innerhalb der nächsten 15 Monate von etwa 1 Million US-Dollar auf 10 Millionen US-Dollar zu steigern.

Wichtigste Punkte:

💡 90 % der Pilotprojekte für generative KI scheitern an der Überführung in die Produktion; Koordinierungsprobleme sind die größte Hürde.

🚀 Die personalisierte Inferenz-Engine von Simplismart erreicht ohne Hardware-Optimierung einen Durchsatz von 501 Token pro Sekunde.

📈 Das Unternehmen arbeitet mit 30 Unternehmenskunden zusammen und strebt einen Jahresumsatz von 10 Millionen US-Dollar innerhalb von 15 Monaten an.