Mercury: Schnelles, mobil einsetzbares Diffusion-LLM der ersten kommerziellen Generation

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 4 Minuten Lesezeit · Feb 28, 2025

Im Bereich der Künstlichen Intelligenz (KI) entsteht gerade eine bahnbrechende Technologie. Inception Labs hat kürzlich die Mercury-Serie von Diffusions-Large-Language-Models (dLLMs) vorgestellt, eine neue Generation von Sprachmodellen, die darauf ausgelegt sind, schnell und effizient hochwertige Texte zu generieren. Im Vergleich zu traditionellen autoregressiven Large-Language-Models ist Mercury bis zu 10-mal schneller und erreicht auf einer NVIDIA H100-Grafikkarte eine Geschwindigkeit von über 1000 Token pro Sekunde – eine Geschwindigkeit, die bisher nur mit kundenspezifischen Chips erreichbar war.

Das erste Produkt der Mercury-Serie, Mercury Coder, ist bereits in der öffentlichen Testphase. Dieses Modell konzentriert sich auf die Codegenerierung und zeigt eine herausragende Leistung. In mehreren Programmier-Benchmark-Tests übertraf es viele bestehende, auf Geschwindigkeit optimierte Modelle wie GPT-4o Mini und Claude3.5Haiku und war dabei fast 10-mal schneller. Entwicklerfeedback zeigt, dass die Code-Vervollständigungen von Mercury besser ankommen. Im Copilot Arena Test erreichte Mercury Coder Mini einen Spitzenplatz und zählt zu den schnellsten Modellen.

Die meisten aktuellen Sprachmodelle verwenden eine autoregressive Methode, d.h. sie generieren Token von links nach rechts nacheinander. Dies führt zwangsläufig zu einem sequentiellen Prozess mit hoher Latenz und hohen Rechenkosten. Mercury hingegen verwendet einen „grob zu fein“-Ansatz. Es beginnt mit reinem Rauschen und verfeinert die Ausgabe schrittweise durch mehrere „Entrauschungs“-Schritte. Dadurch kann das Mercury-Modell bei der Generierung eine parallele Verarbeitung mehrerer Token durchführen, was zu einer besseren Inferenz und strukturierten Antworten führt.

Mit der Einführung der Mercury-Serie zeigt Inception Labs das enorme Potenzial von Diffusionsmodellen im Bereich der Text- und Codegenerierung. Als nächstes plant das Unternehmen die Einführung von Sprachmodellen für Chat-Anwendungen, um die Anwendungsszenarien von Diffusions-Sprachmodellen weiter zu erweitern. Diese neuen Modelle werden über stärkere intelligente Agentenfähigkeiten verfügen und komplexe Planungen und langfristige Generierungen ermöglichen. Ihre Effizienz ermöglicht zudem den Betrieb auf ressourcenbeschränkten Geräten wie Smartphones und Laptops.

Zusammenfassend lässt sich sagen, dass die Einführung von Mercury einen wichtigen Fortschritt in der KI-Technologie darstellt, der nicht nur Geschwindigkeit und Effizienz deutlich verbessert, sondern der Branche auch qualitativ hochwertigere Lösungen bietet.

Offizielle Informationen: https://www.inceptionlabs.ai/news

Online-Demo: https://chat.inceptionlabs.ai/

Wichtigste Punkte:
🌟 Einführung der Mercury-Serie von Diffusions-Large-Language-Models (dLLMs) mit einer Generierungsgeschwindigkeit von über 1000 Token pro Sekunde.
🚀 Mercury Coder konzentriert sich auf die Codegenerierung und liefert in Benchmark-Tests herausragende Ergebnisse, die viele bestehende Modelle übertreffen.
💡 Die innovative Methode der Diffusionsmodelle ermöglicht eine effizientere und präzisere Textgenerierung und eröffnet neue Möglichkeiten für intelligente Agentenanwendungen.

Firefox 142 ist offiziell erschienen: Browser-Erweiterungen unterstützen erstmals lokale KI-Sprachmodelle

Mozilla Firefox 142.0 ist jetzt offiziell veröffentlicht und wird am Dienstag außerhalb der Firma zugänglich sein. Obwohl diese Version nicht viele auffällige neue Funktionen bringt, könnte sie in Bezug auf Erweiterbarkeit breite Diskussionen auslösen. In dieser Version wurden die Unterstützung für Drag-and-Drop von Blob-Bildern verbessert, was den Benutzern bei der Nutzung einen flüssigeren Erlebnis bietet. Zudem wurde die Geschwindigkeit des Scrollens im Lesezeichendialogfeld verbessert, wodurch das Verwalten von Lesezeichen für Nutzer bequemer wird. Diese kleinen Verbesserungen erhöhen das Benutzererlebnis. Für

Die britische Regierung hat ein AI-Tool eingeführt, um die Verwaltungsarbeit im öffentlichen Sektor zu reduzieren

Die britische Regierung hat kürzlich eine neue Initiative mit dem Namen „Künstliche Intelligenz-Modellprojekt“ eingeführt, um durch Nutzung von KI-Technologien Dienstleistungen im öffentlichen Sektor zu verbessern. Dieses Projekt ist ein zentraler Bestandteil des „Transformationsplans“, den Premierminister Keir Starmer vorgeschlagen hat, mit dem Ziel, Zeit für Mitarbeiter vor Ort durch Automatisierung von administrativen Aufgaben und Verwaltungsarbeiten zu sparen. Bildquelle: Das Bild wurde von KI generiert. Der Bildlizenzierungsanbieter ist Midjourney. Ein beeindruckendes Projekt wurde von der Chelsea und Westminster NHS Trust entwickelt, das in der Entlassungsabwicklung besteht.

NVIDIA veröffentlicht das neue Cosmos Reason-Modell und beschleunigt die Entwicklung von Robotik- und Physik-IA

NVIDIA hat auf der SIGGRAPH-Konferenz mehrere Roboter-IA-Entwicklungstools vorgestellt: 1) Das 7 Milliarden Parameter große visuelle Sprachmodell Cosmos Reason, das über physikalische Verständnis und Gedächtnisfähigkeit verfügt; 2) Cosmos Transfer-2 und eine reduzierte Version, die die Erstellung synthetischer Trainingsdaten beschleunigt; 3) Eine Neurale Rekonstruktionsbibliothek für die 3D-Szenensimulation; 4) RTX Pro Blackwell-Server und die DGX Cloud-Verwaltungsplattform. Diese Tools werden in Open-Source-Plattformen wie CARLA integriert, um zu unterstützen.

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

Mercury: Schnelles, mobil einsetzbares Diffusion-LLM der ersten kommerziellen Generation

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

Tencent veröffentlicht WeChat-YATT-Trainingsbibliothek für große Modelle, löst zwei zentrale Probleme der multimodalen Ausbildung

Firefox 142 ist offiziell erschienen: Browser-Erweiterungen unterstützen erstmals lokale KI-Sprachmodelle

NVIDIA veröffentlicht ein neues kleines Modell Nemotron-Nano-9B-V2: kostenlos für kommerzielle Nutzung und hervorragende Leistung

Nvidia stellt neue kleine offene Modellreihe Nemotron-Nano-9B-v2 mit intelligentem Schalter für die Schlussfolgerung vor

Die britische Regierung hat ein AI-Tool eingeführt, um die Verwaltungsarbeit im öffentlichen Sektor zu reduzieren

Nvidia investiert 500 Millionen Dollar in die Firma Cohere, deren Bewertung bei 6,8 Milliarden Dollar liegt

Alibaba startet eine Rekrutierungsinitiative mit tausenden KI-Mitarbeitern und legt den Schwerpunkt auf große Modelle und KI-Hardware

Midjourney große Überarbeitung! Standardbenutzer können nun problemlos hochauflösende Videos erstellen!

Der Aufstieg von NVIDIA! Rolls-Royce will mit Kernenergie und Künstlicher Intelligenz neue Höhepunkte erreichen

NVIDIA veröffentlicht das neue Cosmos Reason-Modell und beschleunigt die Entwicklung von Robotik- und Physik-IA

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

Mercury: Schnelles, mobil einsetzbares Diffusion-LLM der ersten kommerziellen Generation

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

Tencent veröffentlicht WeChat-YATT-Trainingsbibliothek für große Modelle, löst zwei zentrale Probleme der multimodalen Ausbildung

Firefox 142 ist offiziell erschienen: Browser-Erweiterungen unterstützen erstmals lokale KI-Sprachmodelle

NVIDIA veröffentlicht ein neues kleines Modell Nemotron-Nano-9B-V2: kostenlos für kommerzielle Nutzung und hervorragende Leistung

Nvidia stellt neue kleine offene Modellreihe Nemotron-Nano-9B-v2 mit intelligentem Schalter für die Schlussfolgerung vor

​Die britische Regierung hat ein AI-Tool eingeführt, um die Verwaltungsarbeit im öffentlichen Sektor zu reduzieren

Nvidia investiert 500 Millionen Dollar in die Firma Cohere, deren Bewertung bei 6,8 Milliarden Dollar liegt

Alibaba startet eine Rekrutierungsinitiative mit tausenden KI-Mitarbeitern und legt den Schwerpunkt auf große Modelle und KI-Hardware

Midjourney große Überarbeitung! Standardbenutzer können nun problemlos hochauflösende Videos erstellen!

Der Aufstieg von NVIDIA! Rolls-Royce will mit Kernenergie und Künstlicher Intelligenz neue Höhepunkte erreichen

NVIDIA veröffentlicht das neue Cosmos Reason-Modell und beschleunigt die Entwicklung von Robotik- und Physik-IA

Die britische Regierung hat ein AI-Tool eingeführt, um die Verwaltungsarbeit im öffentlichen Sektor zu reduzieren