Information

Latest AI News

Explore AI Frontiers, Master Industry Trends

AI Daily Brief

Your Daily AI Brief - Never Miss What's Next

Information

AI Product Finder

Smart Product Discovery - Comprehensive Market Intelligence

AI Product Rankings

AI Product Power Rankings - Performance, Buzz & Trends

AI Product Submit

Submit Your AI Product - Amplify Reach & Drive Growth

Tools

AI Tools Directory

Discover The Best AI Websites & Tools

Tools

GEO Brand Visibility

All-in-One GEO Brand Insights Platform

AI Visibility Audit

Quickly check how your brand is perceived and presented in AI-powered search results.

AI Search Visibility Checker

Detect brand's visibility on AI platforms

GEO Ranking Monitor

Batch queries & scheduled GEO ranking tracking

AI Conversation Insight

Discover trending questions users ask AI to guide content strategy

GEO Promotion Link Detection

Quickly evaluate the citation of promotion articles on AI platforms

Service

GEO Ranking Optimization System

Own your own GEO system and become a professional GEO optimization service provider.

GEO Ranking Optimization

Achieve Dominant Visibility in AI Search for Your Business or Brand with GEO Services

Information

MCP Servers

Discover Popular AI-MCP Services - Find Your Perfect Match Instantly

MCP Client

Easy MCP Client Integration - Access Powerful AI Capabilities

MCP Case Tutorials

Master MCP Usage - From Beginner to Expert

MCP Ranking

Top MCP Service Performance Rankings - Find Your Best Choice

MCP Service Submission

Publish & Promote Your MCP Services

Tools

MCP Playground

Test MCP Services Freely - Quick Online Experience

MCP Inspector

Quick MCP Service Testing - Fast Deployment

Information

LLM API Hub

One-stop integration for all major LLM APIs.

AI Models Finder

Comprehensive AI Models Collection for All Your Development & Research Needs

Model Providers

Discover Trusted AI Model Partners - Guaranteed Reliable Support

LLM Leaderboard

AI LLM Power Rankings - Performance, Buzz & Trends

Tools

LLM API Proxy Checker

Choose reliable LLM API proxies with our 5-dimension test

Compare LLMs

Multi-Dimensional Large Model Comparison - Find Your Perfect Match

LLM Cost Calculator

Calculate AI Model Costs Accurately - Optimize Your Budget

LLM Arena

Multi-Model Real-Time Evaluation & Quick Output Comparison

AI Model Compatibility Checker

Free PC Hardware Test for DeepSeek & Llama

AI Deployment Calculator

Enter Your Large Model Computing Requirements for Instant GPU, Memory & Server Configuration Recommendations

Großmodell-Infervorsorge-Großrevolution! CMU und NVIDIA stoßen gemeinsam Multiverse mit übernatürlicher Geschwindigkeit paralleler Erstellung aus

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 3 Minuten Lesezeit · Jun 18, 2025

Mit dem Fortschritt in der künstlichen Intelligenz wird die Anwendung von großen Sprachmodellen (LSM) immer weiter verbreitet. Aktuell gibt es jedoch noch viele Einschränkungen bei der deduktiven Methode. Der traditionelle sequenzielle Generierungsansatz erzeugt Tokens nacheinander, was ineffizient ist und die parallele Rechenleistung moderner Hardware nicht optimal ausnutzt. Um dieses Problem zu lösen, hat eine Forschungsgruppe von Carnegie Mellon University (CMU) und NVIDIA einen neuen generativen Modelltyp namens Multiverse vorgestellt, der ursprünglich parallel generieren soll und so unsere Vorstellung von der Deduktion mit LSM grundlegend verändert.

Multiverse geht nicht nur davon aus, die Geschwindigkeit der Generierung zu beschleunigen, sondern auch das Architekturdenken neu zu gestalten. Die Forscher entdeckten eine implizite Parallelität im Prozess der aktuellen Mainstream-Langtextmodelle. Basierend auf dieser Entdeckung hat das Multiverse-Framework eine MapReduce-artige Struktur übernommen, die den Generierungsprozess in drei Phasen unterteilt: adaptive Zerlegung der Aufgabe, parallele Durchführung der Teilvorgänge und fehlerfreie Kombination der Ergebnisse. Diese Konstruktion nutzt die Potenz der Rechenressourcen optimal und erreicht eine effizientere Deduktionsmethode.

Nach den Versuchsdaten zeigt Multiverse-32B unter gleichen Kontextlängen eine Performance um fast 2 % höher als sequentielle Modelle. Das deutet darauf hin, dass Multiverse nicht nur in Geschwindigkeit signifikant steigt, sondern auch hervorragende Erweiterbarkeit bietet und bei unterschiedlichen Batching-Größen bis zu doppelt so schnell arbeiten kann. Um diese Errungenschaft noch weiter anzuwenden, hat die Forschungsgruppe das gesamte Multiverse-Ökosystem, einschließlich der Daten, Modellgewichte und Trainingsdetails, offengelegt, damit andere Forscher weiter daran forschen können.

In der praktischen Anwendung kann Multiverse je nach Generierungsbedarf flexibel angepasst werden und durch einen spezialisierten Steuertag die dynamische Umstellung zwischen sequentieller und paralleler Generierung realisieren, wodurch die Kohärenz und Logik der generierten Inhalte sichergestellt werden. Mit dieser Technologie wird dem Bereich der Natürlichen Sprachverarbeitung neues Leben eingehaucht, und wir freuen uns darauf, ihre Praxisleistung zu erleben.

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe