Microsoft hat offiziell die neue Geräte-End- kleine Sprachmodell (SLM) Mu vorgestellt, das speziell für die Einstellungen-App in Windows 11 entwickelt wurde und ein intelligentes AI-Agent ist. Dies markiert einen wichtigen Durchbruch bei der lokalen KI-Technologie in der Betriebssystem-Interaktion. Als kompakter und effizienter Modell optimiert Mu die Ausführung auf dem neuronalen Verarbeitungseinheit (NPU) und bietet den Nutzern eine natürliche Sprachinteraktion mit geringer Latenz und hoher Privatsphäre. AIbase hat die Highlights und die Brancheneinflüsse von Mu zusammengefasst und gibt einen Einblick in die Details.

Mu: Das intelligente Kernmodell für Windows-Einstellungen

Mu ist ein Encoder-Decoder-Sprachmodell mit 330 Millionen Parametern, das speziell für die NPU auf Co pilot+ PC optimiert wurde. Ziel ist es, die Windows-Einstellungen durch natürliche Sprachbefehle zu vereinfachen. Zum Beispiel kann der Benutzer einfach „Schalten Sie den Dunkelmodus ein“ oder „Erhöhen Sie die Bildschirmhelligkeit“ sagen, und Mu ruft direkt die entsprechenden Einstellungsfunktionen auf, ohne dass man manuell komplexe Menüs durchsuchen muss. Dieses AI-Agent ist bereits im Windows Insiders Dev Channel von Co pilot+ PC für Tests verfügbar und unterstützt die präzise Verständnis und Ausführung von Hunderten von Systemeinstellungen.

image.png

Zu den Schlüsselmerkmalen von Mu gehören:

Effiziente lokale Verarbeitung: Es läuft vollständig auf dem Gerät, mit einer Antwortgeschwindigkeit von über 200 Proben pro Sekunde, wobei die Verzögerung bei der Erzeugung des ersten Wortes um etwa 47 % reduziert und die Decodierungsgeschwindigkeit um das 4,7-fache gesteigert wird.

Privatsphäre im Vordergrund: Die lokale Verarbeitung benötigt keine Übertragung von Nutzerdaten in die Cloud und erhöht dadurch die Daten Sicherheit erheblich.

Hardware-Kooperation: Es ist tief mit den NPU von AMD, Intel und Qualcomm abgestimmt, um eine hohe Leistung über verschiedene Plattformen hinweg sicherzustellen.

Diese Merkmale machen Mu zu einem revolutionären Werkzeug für die Interaktion der Windows 11-Nutzer, insbesondere für persönliche und unternehmensbezogene Nutzer, die Effizienz und Privatsphäre verlangen.

Technologische Innovation: Der Weg zur Optimierung von Cloud zu Edge

Die Entwicklung von Mu basiert auf Microsofts tiefem Wissen in der kleinen Sprachmodell-Technologie und baut auf den Erfahrungen des vorherigen Phi-Silica-Modells auf. Es verwendet eine Encoder-Decoder-Architektur, was im Vergleich zu traditionellen nur-Decoder-Modellen den Berechnungs- und Speicherverbrauch deutlich senkt und besonders für Edge-Geräte geeignet ist. Microsoft hat folgende Technologien eingesetzt, um die maximale Effizienz von Mu zu erreichen:

Quantisierungstechnik: Die Modellgewichte werden von Fließkommazahlen in niedrige Ganzzahlen konvertiert, wodurch der Speicherbedarf reduziert und die Inferenzgeschwindigkeit verbessert wird, wobei die Genauigkeit hoch bleibt.

Parameterfreigabe: Die Gewichte des Eingangscodierers und des Ausgangsdekoders sind gemeinsam genutzt, wodurch die Modellgröße weiter reduziert wird.

Aufgaben-spezifische Feinabstimmung: Mu wurde mit über 3,6 Millionen Stichproben feinjustiert, um eine präzise Verständnis und Ausführung komplexer Anweisungen zu gewährleisten, die sich auf die Windows-Einstellungen beziehen.

Der Trainingsprozess von Mu wurde auf der Azure Machine Learning-Plattform mit NVIDIA A100-GPUs durchgeführt, kombiniert mit hochwertigen Bildungsdaten und der Wissensverdichtungstechnik des Phi-Modells, um die exzellente Leistung des Modells bei kleiner Parameteranzahl sicherzustellen.

Benutzererfahrung: Von komplizierten Menüs zu natürlichen Gesprächen

Die Komplexität der Windows-Einstellungen-App hat lange Zeit die Nutzer belastet, doch Mu hat diese Situation völlig verändert. Durch natürliche Sprachinteraktion können die Nutzer Einstellungen anpassen, ohne in Menüs tief einzudringen, wodurch der Zugangsweg stark reduziert wird. Zum Beispiel können unklare Befehle wie „Helligkeit erhöhen“ (was möglicherweise den Haupt- oder Nebenbildschirm betrifft), von Mu durch Priorisierung üblicher Einstellungen und Integration traditioneller Suchergebnisse genau ausgeführt werden.

Momentan unterstützt Mu nur Co pilot+ PCs mit Qualcomm Snapdragon X-Serie-Prozessoren, aber Microsoft hat zugesagt, es künftig auch auf NPU-Geräte von AMD und Intel auszuweiten und so eine breitere Nutzerbasis abzudecken.

Branchenbedeutung und Zukunftsaussichten

Die Veröffentlichung von Mu ist nicht nur ein Meilenstein für Microsoft im Bereich Gerätendienst-KI, sondern spiegelt auch den Trend der Branche wider, zu effizienten, privatsphäreorientierten Edge-KI-Computing-Systemen zu wechseln. Im Vergleich zu großen Sprachmodellen (LLM), die auf der Cloud basieren, erreicht Mu mit geringerem Ressourcenverbrauch eine Leistung, die nahe an der von Phi-3.5-mini liegt, und zeigt damit das große Potenzial kleiner Modelle.

Allerdings stehen die Implementierung von Mu noch Herausforderungen gegenüber:

Hardware-Beschränkungen: Es ist aktuell nur auf bestimmten Hochleistungs-Co pilot+ PCs beschränkt, und die Verbreitung hängt vom Fortschritt der NPU-Hardware ab.

Verarbeitung komplexer Befehle: Bei unklaren oder mehrdeutigen Befehlen hat Mu noch Raum zur Verbesserung.

Ökosystem-Erweiterung: Die Branche fragt sich, ob Microsoft Mu für Entwickler anpassbar macht oder auf andere Anwendungsbereiche ausweitete.

AIbase glaubt, dass der Erfolg von Mu die tiefere Integration von Betriebssystemen und KI vorantreiben wird und in Zukunft möglicherweise viele lokale KI-Agenten hervorbringen wird, die die menschliche Maschineninteraktion neu definieren. Wir werden weiterhin auf die Updates und Rückmeldungen zu Mu achten und bitten Sie, uns auf Twitter zu folgen, um die neuesten Entwicklungen in der KI-Technologie zu erfahren.

Blog: https://blogs.windows.com/windowsexperience/2025/06/23/introducing-mu-language-model-and-how-it-enabled-the-agent-in-windows-settings/