Red Hat联合谷歌和NVIDIA启动llm-d开源项目，破解大规模AI推断成本与延迟双重难题

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 5 Minuten Lesezeit · May 27, 2025

Die weltweit führende Anbieterin offener Quellcodes, Red Hat, hat kürzlich den revolutionären Open-Source-Projekt llm-d gestartet, um dringende Nachfrage nach der massenskalierbaren Inferenz in generativen KI zu befriedigen. Das Projekt vereint Industrie-Giganten wie CoreWeave, Google Cloud, IBM Research und NVIDIA als Stiftungsmitwirkende und zielt darauf ab, durch bahnbrechende Technologien die Leistungsfähigkeit von Sprachmodellen im Cloud-Umfeld für die strengsten Produktionsservice-Ziele zu erreichen.

Inferenz-Zeitpunkt naht, Herausforderungen nehmen zu

Laut neuesten Prognosen von Gartner wird "bis 2028 achtzig Prozent aller Beschleuniger-Arbeitslasten in Datenzentren speziell für Inferenz und nicht für Schulung verwendet werden." Diese Tendenz unterstreicht die strategische Bedeutung der Inferenztechnologie.

Dennoch steigt mit der Komplexität und dem Umfang der Inferenzmodelle auch die Ressourcenanforderung stark an, was die Machbarkeit zentraler Inferenz-Lösungen begrenzt. Zu hohe Kosten und längere Latenzen könnten dabei potenzielle Schlüsselhemmnisse für die KI-Innovation darstellen und erfordern dringend neue technologische Lösungen.

Roboter KI Künstliche Intelligenz

llm-d: Innovation auf dem Weg zur einheitlichen Plattform

Red Hat und ihre Partner greifen mit dem llm-d-Projekt diese Herausforderungen direkt an und integrieren fortschrittliche Inferenzfähigkeiten in bestehende Unternehmens-IT-Infrastrukturen. Die einheitliche Plattform ermöglicht IT-Teams, gleichzeitig verschiedene Dienstleistungsanforderungen für kritische Geschäftsaufgaben zu erfüllen, innovative Technologien einzusetzen und die Gesamtkosten der Nutzung hochleistungsfähiger KI-Acceleratoren erheblich zu senken.

Der Kernwert dieser Lösung besteht darin, traditionelle Inferenz-Bereitstellungen zu überwinden und Unternehmen flexiblere, effizientere und kostengünstigere KI-Inferenz-Optionen anzubieten.

Starker Industrieallianz-Unterstützung

Das llm-d-Projekt genießt die Unterstützung einer starken Allianz aus Anbietern von generativen KI-Modellen, Pionieren der KI-Acceleration und führenden AI-Cloud-Plattformen. Neben den vier Stiftungsmitwirkenden haben wichtige Unternehmen wie AMD, Cisco, Hugging Face, Intel, Lambda und Mistral AI ebenfalls als Partner dem Projekt beigetreten und zeigen den Wunsch nach tiefer Zusammenarbeit bei der Gestaltung der Zukunft großer LLM-Dienste.

Industrielle Führungsfiguren sprechen sich aus

„Während Unternehmen KI in Massen skalieren und Wertschöpfung für Nutzer schaffen, ist effiziente KI-Inferenz entscheidend“, betonte Mark Lohmeyer, Vizepräsident und Generaldirektor für KI und Recheninfrastruktur bei Google Cloud. „Im Zuge unseres Übergangs in die Ära der Inferenz ist es uns eine Ehre, als Stiftungsmitwirkender des llm-d-Projekts zu fungieren und auf unserer Open-Source-Beitragsbasis weiter voranzutreiben.“

„Das llm-d-Projekt ergänzt die Open-Source-KI-Okosysteme wesentlich und spiegelt NVIDIAs Engagement wider, Kollaborationen für die Generierung von KI-Innovationen voranzutreiben“, sagte Ujval Kapasi, Vizepräsident für Ingenieurwesen von AI Frameworks bei NVIDIA. „Skalierbare, leistungsstarke Inferenz ist entscheidend für die nächste Welle generativer KI und agentenbasierter KI. Wir arbeiten mit Red Hat und anderen Unterstützern zusammen, um Innovationen wie NIXL von NVIDIA zu nutzen und die Entwicklung von llm-d zu beschleunigen.“

Open Source treibt industriellen Wandel voran

Die Einführung des llm-d-Projekts markiert einen neuen Entwicklungsabschnitt im Bereich der KI-Inferenz. Durch das Open-Source-Modell wird Branchenintelligenz gesammelt, wodurch dieses Projekt nicht nur die gegenwärtigen Kosten- und Leistungsprobleme der großen Inferenz-Lösungen lösen könnte, sondern auch die nachhaltige Entwicklung des gesamten KI-Ekosystems festigen wird.

Mit zunehmender Beteiligung von Unternehmen und Entwicklern hat llm-d das Potenzial, eine wichtige Kraft zur Normierung und Popularisierung der KI-Inferenztechnologie zu werden und somit auf den kommenden Inferenz-Zeitpunkt optimal vorbereitet zu sein.

Generative AI redhat llm-d CoreWeave

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe

Empfohlene verwandte KI-Nachrichten

Neuer AI-Chip-Unternehmen Groq nähert sich der Finanzierung mit einem Bewertungssprung auf 6 Milliarden US-Dollar!

Die AI-Chip-Start-up-Gesellschaft Groq verhandelt derzeit über eine neue Finanzierung von 6 Milliarden US-Dollar, wobei ihre Bewertung auf 6 Milliarden US-Dollar steigt, was fast doppelt so hoch ist wie die Bewertung von 2,8 Milliarden US-Dollar im letzten Jahr. Das Unternehmen wurde von Entwicklern der TPU von Google gegründet und hat kürzlich wichtige Partnerschaften mit Bell Canada und Meta geschlossen, um das AI-Infrastrukturprojekt zu unterstützen. Diese Finanzierung wird von Disruptive angeführt, und frühere Investoren umfassen renommierte Institutionen wie Blackstone und Cisco.

Jul 30, 2025

AI-Tageszeitung: Volcano Engine veröffentlicht Doubao 3.0; Tongyi open-sourcet Qwen3-Modell ohne Denkprozess; Google aktualisiert Imagen 4 heimlich

1. Vulkan Engine verbessert AI-Bildbearbeitung und Übersetzung. 2. Qwen3-30B Open-Source-Modell ähnlich GPT-4o. 3. ChatGPT Study als Lernhilfe. 4. HYPIR restauriert Fotos in 1,7s. 5. NotebookLM mit Video-Zusammenfassung. 6. Imagen4 übertrifft GPT-4o. 7. Skywork UniPic als Open Source. 8. Ideal i8 mit VLA-Modell. 9. Gemini2.5 in UK-Suche. 10. OWL veröffentlicht Eigent. 11. DeepSeek 2025 schnellstwachsende App.....

Jul 30, 2025

Zuckerbergs Rekrutierungsplan wird enthüllt! Meta versucht vergeblich, AI-Experten mit hohen Gehältern anzuziehen

Meta-Chef Zuckerberg wirbt erfolglos KI-Talente von TML mit Milliardenangeboten ab. Trotz Versprechen eines weltweiten KI-Assistenten und Open-Source-Strategie bevorzugen Forscher TMLs klare Vision nach 12 Mrd. Funding.....

Jul 30, 2025

AMD bringt eine wichtige Aktualisierung! Ryzen AI Max+ 395 macht es real, ein 128-Billionen-Parameter-Modell lokal auszuführen!

AMD Ryzen AI Max+395 Prozessor ermöglicht erstmals lokales Ausführen von 128-Milliarden-Parametermodellen. Benötigt 128GB RAM (96GB als VRAM), läuft Meta Llama4Sout mit 109 Milliarden Parametern. MOE-Technik, 15 Tokens/Sekunde, bis zu 256.000 Tokens Kontext. Mini-AI-Workstation mit 128GB für 13.000 RMB.....

Jul 30, 2025

Alibaba 1688 umarmt künstliche Intelligenz vollständig: Veröffentlicht die AI-Version der App und 88Chao, um Käufer bei effizienten Einkäufen zu unterstützen

1688 veröffentlicht mehrere AI-Updates, darunter die 1688 AI-Version der App und das Werkzeug 88Chao, um kleine und mittlere Unternehmen bei ihren Einkäufen zu unterstützen. Die 1688 AI-Version integriert fünf Funktionen: AI-Suche, Produktauswahl, Produktentwicklung, Bildsuche und Unternehmensinformationen. Sie deckt den gesamten Geschäftsprozess ab. 88Chao unterstützt natürliche Sprachabfragen zu Unternehmenszertifizierungen und Fertigungskapazitäten und generiert Branchenberichte. Die AI-Fähigkeiten werden auch auf PC- und Mobilgeräten zugänglich sein, um die Effizienz bei der Produktauswahl und den Einkaufserlebnis zu verbessern und kleinen und mittleren Unternehmen bei ihrer Digitalisierung zu helfen.

Jul 30, 2025

Google startet in Großbritannien einen AI-Suchmodus, um die Erfahrung bei der Beantwortung komplexer Fragen zu verbessern

Google hat in Großbritannien einen neuen AI-Suchmodus eingeführt, der auf dem Modell Gemini 2.5 basiert und komplexe Fragen unterstützt. Er kann mehrteilige Fragen verarbeiten. Die neue Funktion verwendet Techniken zur Erweiterung von Suchanfragen, bei denen die Frage in Unterpunkte zerlegt und parallel gesucht wird, um genauere Antworten zu liefern. Sie unterstützt verschiedene Interaktionsformen wie Text, Sprache und Bilder. Benutzer können Bilder oder Sprachanfragen hochladen. Der AI-Modus bewertet die Vertrauenswürdigkeit der Antwort und wechselt in den traditionellen Suchmodus, wenn das Vertrauen niedrig ist. Diese Funktion zielt darauf ab, die Tiefe und Effizienz der Suche zu verbessern und gleichzeitig die Vielfalt des Website-Verkehrs zu fördern. Derzeit befindet sich die Funktion noch in der Optimierung, und Google ermutigt die Benutzer, Feedback zu geben.

Jul 30, 2025

Apple AI-Team erleidet erneut schwere Verluste, vier Experten wurden von Meta abgeworben

Apple verliert vier KI-Experten an Meta, darunter Schlüsselmitarbeiter. Metas aggressive Rekrutierung und hohe Gehälter stellen Apples KI-Strategie infrage.....

Jul 30, 2025

Neue AI-Tools von Adobe Photoshop sind verfügbar – die Kreativität wird einfacher!

Jul 30, 2025

Die Hongkong Polytechnic University und Ant Tech gründen gemeinsam ein AI+Web3-Technologiezentrum

Die Hongkong Polytechnic University und Ant Tech unterzeichneten einen strategischen Kooperationsvertrag und gründeten gemeinsam ein AI+Web3-Technologiezentrum. Die beiden Parteien werden in drei technologischen Bereichen, darunter vertrauenswürdige AI-Agenten und Blockchain-Sicherheitsrahmenwerke, zusammenarbeiten. Ant Tech plant, innerhalb von drei Jahren 100 Millionen HKD zu investieren. Das Zentrum wird eine Bildungs-Förderungsplattform aufbauen, internationale akademische Aktivitäten organisieren und dabei helfen, Hongkong zu einem Zentrum für digitale Technologietalente zu machen. Die Hongkong Polytechnic University ist weltweit führend im Bereich Blockchain, während Ant Tech über praktische Erfahrung im Finanztechnologie-Bereich verfügt. Diese Zusammenarbeit wird die Integration von KI und Web3-Technologie fördern und die Entwicklung von Hongkongs internationaler Wissenschafts- und Technologiezentrum unterstützen.

Jul 29, 2025

Canva kooperiert mit Claude AI und bringt eine bedeutende Verbesserung! Ein Klick und schon wird aus Chat professionelle Gestaltung – die Kreativitätseffizienz steigt stark

Canva und Claude AI haben eine tiefgreifende Zusammenarbeit eingegangen und verbinden sich über das Modell-Context-Protokoll (MCP). Nutzer können jetzt Canva-Entwürfe direkt in der Claude-Chatschnittstelle erstellen, bearbeiten und verwalten. Natürliche Sprachbefehle ermöglichen die Erstellung von Plakaten, die Bearbeitung von sozialen Medieninhalten usw. Zu den Kernfunktionen zählen: sofortige Entwurfsgenerierung, intelligente Bearbeitungssuche, automatische Inhaltszusammenfassung und vieles mehr, was die Gestaltungseffizienz erheblich steigert. Dieser Dienst ist derzeit nur für bezahlte Nutzer verfügbar, die niedrigste Abonnementkosten betragen etwa 32 Dollar pro Monat. Diese Partnerschaft markiert einen Meilenstein für die Nutzung von KI außerhalb des Chats.

Jul 29, 2025

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

Red Hat联合谷歌和NVIDIA启动llm-d开源项目，破解大规模AI推断成本与延迟双重难题

AIbase基地

Inferenz-Zeitpunkt naht, Herausforderungen nehmen zu

llm-d: Innovation auf dem Weg zur einheitlichen Plattform

Starker Industrieallianz-Unterstützung

Industrielle Führungsfiguren sprechen sich aus

Open Source treibt industriellen Wandel voran

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

Neuer AI-Chip-Unternehmen Groq nähert sich der Finanzierung mit einem Bewertungssprung auf 6 Milliarden US-Dollar!

AI-Tageszeitung: Volcano Engine veröffentlicht Doubao 3.0; Tongyi open-sourcet Qwen3-Modell ohne Denkprozess; Google aktualisiert Imagen 4 heimlich

Zuckerbergs Rekrutierungsplan wird enthüllt! Meta versucht vergeblich, AI-Experten mit hohen Gehältern anzuziehen

AMD bringt eine wichtige Aktualisierung! Ryzen AI Max+ 395 macht es real, ein 128-Billionen-Parameter-Modell lokal auszuführen!

Alibaba 1688 umarmt künstliche Intelligenz vollständig: Veröffentlicht die AI-Version der App und 88Chao, um Käufer bei effizienten Einkäufen zu unterstützen

Google startet in Großbritannien einen AI-Suchmodus, um die Erfahrung bei der Beantwortung komplexer Fragen zu verbessern

Apple AI-Team erleidet erneut schwere Verluste, vier Experten wurden von Meta abgeworben

Neue AI-Tools von Adobe Photoshop sind verfügbar – die Kreativität wird einfacher!

Die Hongkong Polytechnic University und Ant Tech gründen gemeinsam ein AI+Web3-Technologiezentrum

Canva kooperiert mit Claude AI und bringt eine bedeutende Verbesserung! Ein Klick und schon wird aus Chat professionelle Gestaltung – die Kreativitätseffizienz steigt stark