PyTorch 2.8 mit großer Markenwerbung: Quantisierung von LLM-Inferenzleistung springt vorwärts, Intel-GPU-Unterstützung kommt!

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 3 Minuten Lesezeit · Aug 8, 2025

Kürzlich wurde die neue Version 2.8 des Open-Source-Maschinenlernframeworks PyTorch offiziell veröffentlicht. Diese Version hat große Aufmerksamkeit erregt, insbesondere durch die Verbesserung der Inferenzleistung quantisierter großer Sprachmodelle (LLM), insbesondere auf Intel-CPU. Dieses Update verbessert nicht nur signifikant die Inferenzgeschwindigkeit im Offline-Modus, sondern bietet erstmals experimentellen Support für einen verteilten Backend auf Intel-GPU.

Im PyTorch 2.8 haben Entwickler durch Optimierung von Algorithmen und Einführung neuer Technologien die Inferenzgeschwindigkeit quantisierter LLM deutlich gesteigert. Konkret unterstützt diese Version verschiedene Quantisierungsmodi wie A16W8, DA8W8 und A16W4. Testdaten zeigen, dass bei der Ausführung des Llama-3.1-8B-Modells auf der sechsten Generation von Intel Xeon mit M=8, K und 32 Kernen, die End-to-End-Verzögerung um mehr als 20 % reduziert wurde und die Leistung sogar mit einigen beliebten LLM-Service-Frameworks mithalten kann.

Zudem ist ein weiterer Highlight dieses Updates die experimentelle Unterstützung des XCCL-verteilten Backends für Intel-discrete GPU in PyTorch 2.8. Diese Funktion bietet mehr Flexibilität für verschiedene Trainingsmodi und ermöglicht es Entwicklern, das Potenzial ihrer Modelle in einer breiteren Hardwareumgebung zu nutzen.

Außerdem beinhaltet PyTorch 2.8 eine Reihe wichtiger Verbesserungen. Zum Beispiel wird durch die Einführung von SYCL-Support die C++-Erweiterungs-API von PyTorch reicher, und XPU-Geräte erhalten zudem Unterstützung für das A16W4-Modus. Darüber hinaus hat das Entwicklungsteam stabile Schnittstellen für libtorch ABI bereitgestellt, wodurch Kompatibilitätsprobleme in Drittanbieter-C++/CUDA-Erweiterungen reduziert werden.

Die Unterstützung für ROCm wurde ebenfalls verbessert, indem Unterstützung für den gfx950-Architektur hinzugefügt wurde. Zusammen mit TorchInductor und AOTInductor werden mehrere Kernel-Vorlagen zur automatischen Optimierung bereitgestellt. Außerdem wurden Kontrollflussoperationen wie bedingte Anweisungen und Schleifen eingeführt, was die Kompilierung und Exportierung von Modellen effizienter macht.

Die Veröffentlichung von PyTorch 2.8 bringt zweifellos mehr Möglichkeiten in den Bereich des maschinellen Lernens und bietet Entwicklern leistungsstärkere Werkzeuge, die die Anwendung und Entwicklung großer Sprachmodelle voranbringen.

Download-Link: https://github.com/pytorch/pytorch/releases/tag/v2.8.0

OpenAI kündigt an, dass indische Nutzer ein Jahr kostenlosen ChatGPT Go-Service erhalten

OpenAI kündigte an, dass ab dem 4. November indische Nutzer kostenlosen ChatGPT Go-Service für ein Jahr erhalten. Entscheidung wurde während der DevDay Exchange-Veranstaltung in Bangalore bekanntgegeben. ChatGPT Go wurde im August dieses Jahres eingeführt und bietet erweiterte Funktionen, einschließlich höherer Nachrichtensendegrenzen und mehr Nutzungsmöglichkeiten pro Tag. Der kostenlose Service steht allen indischen Nutzern frei, die während der Werbeaktion registriert wurden.

2025 Halbjahr: Chinas AI IaaS-Markt erreicht 19,87 Milliarden Yuan mit einer Wachstumsrate von 122,4%

Laut IDC-Bericht erreichte der chinesische AI IaaS-Markt im ersten Halbjahr 2025 einen Wert von 19,87 Milliarden Yuan und wuchs um 122,4%. Besonders auffällig war der Bereich generative KI IaaS mit einem Marktvolumen von 16,68 Milliarden Yuan und einer Wachstumsrate von 219,3%. Der Rest des AI IaaS-Marktes verringerte sich um 14,1% auf 3,19 Milliarden Yuan. Cloud-Anbieter erhöhen kontinuierlich ihre Investitionen in die AI-Infrastruktur.

Google wird zum offiziellen Cloud-Service-Provider der Olympischen Sommerspiele 2028 in Los Angeles, AI wird die gesamte Event-Erfahrung erheblich verbessern

Das Organisationskomitee der Olympischen Sommerspiele 2028 in Los Angeles gab bekannt, dass Google zum offiziellen Cloud-Service-Anbieter und Gründungspartner ernannt wurde. Die Zusammenarbeit erstreckt sich auf den US Olympic Committee und den Übertragungsunternehmen NBC Universal. Google wird Cloud-Computing- und KI-Technologien bereitstellen, um die Veranstaltungsorganisation zu unterstützen.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services

AI Model Compatibility Checker

AI Deployment Calculator

PyTorch 2.8 mit großer Markenwerbung: Quantisierung von LLM-Inferenzleistung springt vorwärts, Intel-GPU-Unterstützung kommt!

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

OpenAI kündigt an, dass indische Nutzer ein Jahr kostenlosen ChatGPT Go-Service erhalten

Studie enthüllt, dass große Mengen an Müll-Daten die Inferenzfähigkeit von großen Sprachmodellen beeinträchtigen

Chesky: Airbnb verzögert den Zugang zu ChatGPT, der AI-Customer-Service nutzt bereits Tongyi Qianwen

Mit Modell-Reasoning-Problemen umgehen: Das MIND-Team von Apple beschleunigt die Rekrutierung von KI-Experten

2025 Halbjahr: Chinas AI IaaS-Markt erreicht 19,87 Milliarden Yuan mit einer Wachstumsrate von 122,4%

Adobe stellt den AI Foundry-Service vor: generative KI-Modelle, die auf Markenassets abgestimmt sind

Alibaba veröffentlicht Qoder CLI, ein AI-basiertes Befehlszeilenprogramm für die Programmierung: Speicherbelastung reduziert um 70 %, Effizienz der Code-Überprüfung um 50 % gesteigert

Google wird zum offiziellen Cloud-Service-Provider der Olympischen Sommerspiele 2028 in Los Angeles, AI wird die gesamte Event-Erfahrung erheblich verbessern

Vorherige Stability AI-CEO: Die KI-Revolution wird den Wert menschlicher Intelligenz nullen. In den nächsten 1000 Tagen steht eine große Veränderung bevor

Zebra Intelligent Driving präsentiert mit Schock! Das weltweit erste vollständige multimodale AI-Größenmodell-Autosystem führt die Trendwende der Fahrzeugintelligenz ein

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

PyTorch 2.8 mit großer Markenwerbung: Quantisierung von LLM-Inferenzleistung springt vorwärts, Intel-GPU-Unterstützung kommt!

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

OpenAI kündigt an, dass indische Nutzer ein Jahr kostenlosen ChatGPT Go-Service erhalten

Studie enthüllt, dass große Mengen an Müll-Daten die Inferenzfähigkeit von großen Sprachmodellen beeinträchtigen

Chesky: Airbnb verzögert den Zugang zu ChatGPT, der AI-Customer-Service nutzt bereits Tongyi Qianwen

Mit Modell-Reasoning-Problemen umgehen: Das MIND-Team von Apple beschleunigt die Rekrutierung von KI-Experten

2025 Halbjahr: Chinas AI IaaS-Markt erreicht 19,87 Milliarden Yuan mit einer Wachstumsrate von 122,4%

Adobe stellt den AI Foundry-Service vor: generative KI-Modelle, die auf Markenassets abgestimmt sind

Alibaba veröffentlicht Qoder CLI, ein AI-basiertes Befehlszeilenprogramm für die Programmierung: Speicherbelastung reduziert um 70 %, Effizienz der Code-Überprüfung um 50 % gesteigert

Google wird zum offiziellen Cloud-Service-Provider der Olympischen Sommerspiele 2028 in Los Angeles, AI wird die gesamte Event-Erfahrung erheblich verbessern

Vorherige Stability AI-CEO: Die KI-Revolution wird den Wert menschlicher Intelligenz nullen. In den nächsten 1000 Tagen steht eine große Veränderung bevor

Zebra Intelligent Driving präsentiert mit Schock! Das weltweit erste vollständige multimodale AI-Größenmodell-Autosystem führt die Trendwende der Fahrzeugintelligenz ein

GEO Services