Die Inferenzfähigkeit des TRM-Modells mit 7 Millionen Parametern übertrifft sogar Gemini 2.5 Pro und Claude 3.7

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 5 Minuten Lesezeit · Oct 10, 2025

Wissenschaftler des Samsung SAIL Montreal Lab haben kürzlich eine neue AI-Architektur namens „Mini-Recursive Model“ (TRM) vorgestellt. Dieses Modell hat nur 7 Millionen Parameter, weit weniger als die kleinsten Sprachmodelle (LLM), die oft Milliarden von Parametern haben, und zeigte dennoch erstaunliche Effizienz und hervorragende Leistung bei komplexen strukturierten Reasoning-Aufgaben wie Sudoku und ARC-AGI-Tests, wodurch es mehrere große Sprachmodelle wie Gemini2.5Pro und Claude3.7 übertraf.

Roboter AI Künstliche Intelligenz

Rekursive Schlussfolgerungsmechanismus: Enge korrigierende Schleifen

Laut der Forschungsarbeit „Less is More: Recursive Reasoning Based on Miniature Networks“ erreichte TRM auf ARC-AGI-1 eine Genauigkeit von 45 % und auf ARC-AGI-2 eine Genauigkeit von 8 %. Seine Leistung übertrifft größere Modelle wie o3-mini-high (Genauigkeit 3,0 % auf ARC-AGI-2), Gemini2.5Pro (4,9 %), DeepSeek R1 (1,3 %) und Claude3.7 (0,7 %). Die Autoren betonten, dass TRM dies mit weniger als 0,01 % der Parameter erreicht, die in den meisten großen Modellen verwendet werden. Systeme wie Grok-4-thinking (16,0 %) und Grok-4-Heavy (29,4 %) sind weiterhin führend.

Die Autoren betonten, dass TRM mit weniger als 0,01 % der Parameter, die in den meisten großen Modellen verwendet werden, eine Genauigkeit von 45 % auf ARC-AGI-1 und 8 % auf ARC-AGI-2 erzielte und somit verschiedene größere allgemeine Modelle übertraf. Auf anderen Benchmarks zeigte TRM ebenfalls beeindruckende Ergebnisse und erhöhte die Genauigkeit für Sudoku-Extreme von 55,0 % auf 87,4 % und die Genauigkeit für Maze-Hard von 74,5 % auf 85,3 %.

Forschungssinn und Grenzen

Die Ergebnisse der TRM-Forschung zeigen das enorme Potenzial von kleinen, gezielt entwickelten Modellen bei der Bearbeitung eng begrenzter, strukturierter Schlussfolgerungsaufgaben. Es kann durch schrittweise Verbesserungen und Datenverstärkung eine sehr hohe Effizienz erreichen. Die Forschung zeigt auch, dass die Auswahl der Architektur (z. B. die Verwendung eines einfachen MLP anstelle von Aufmerksamkeitsmechanismen in einem festen Gittergrößenbereich) entscheidend für den Erfolg ist.

Doch TRM ist kein Ersatz für allgemeine LLMs. Es läuft in definierten Gitterproblemen und ist kein Generatormodell, daher nicht für offene, textbasierte oder multimodale allgemeine Aufgaben geeignet.

Im Gegenteil stellt TRM einen vielversprechenden Baustein für Schlussfolgerungsaufgaben dar, der eine neue Richtung im Gleichgewicht zwischen Recheneffizienz und komplexer Schlussfolgerungsfähigkeit zeigt und möglicherweise in Zukunft seine Anwendungsbereiche erweitern wird. Unabhängige Nachbildungen und Tests laufen noch.

Das Auftauchen von TRM unterstreicht, dass in der KI-Branche architektonische Innovation und algorithmische Optimierung möglicherweise wichtiger sind als die reine Suche nach Modellgröße. Welche vertikalen Bereiche werden Sie denken, in denen solche „kleinen und präzisen“ KI-Modelle in Zukunft am wahrscheinlichsten in großem Umfang angewandt werden?

Mikro-Rekursionsmodell SamsungSAIL AI-Architektur ARC-AGI-Test

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe

Empfohlene verwandte KI-Nachrichten

HYPERCLOUD stellt das erste interaktive AI-Podcast in China vor, bei dem Benutzer jederzeit Fragen stellen können

Tencent Hunyuan startet ersten interaktiven KI-Podcast in China. Nutzer können per Sprache oder Text live Fragen an Moderatoren und Gäste stellen, was die Einseitigkeit traditioneller Podcasts durchbricht und Interaktivität sowie Informationszugang verbessert.....

Oct 29, 2025

220

AI-Tageszeitung: Douyin veröffentlicht ein vollautomatisches System für Mehrpersonen-Sprechersysteme; Adobe Firefly Image 5 erhebliche Verbesserungen; Soul- Sprachmodell SoulX-Podcast wird vorgestellt

Das Sprachteam von Douyin stellt eine vollautomatische AI-Mehrpersonen-Hörspiel-Produktionsmethode vor, die Romane automatisch in Mehrpersonen-Sprecherspiele umwandeln kann. Die Genauigkeit der Rollenerkennung erreicht 98 % und ist mit dem Niveau professioneller Hörspiele vergleichbar, wodurch die Effizienz der Produktion von AI-Hörinhalten erheblich gesteigert wird.

Oct 29, 2025

190

Qualcomm dringt in den Datenbank-Markt ein! Einführung der AI200/AI250-Chips mit Ziel Nvidia, Aktienkurs steigt um 20% an einem Tag

Qualcomm hat zwei Cloud-AI-Inferring-Chips, AI200 und AI250, vorgestellt und plant deren kommerzielle Nutzung im Jahr 2026 bzw. 2027. Dies markiert den Übergang von Endgeräte-Chips zu einer vollständigen AI-Infrastruktur. Die Nachricht führte zu einem Anstieg des Aktienkurses um mehr als 20% an einem Tag und ist der größte Anstieg seit 2019. Im Gegensatz zur allseitigen Strategie von Nvidia konzentriert sich Qualcomm auf den Markt für große Modell-Inferring und betont die Vorteile der Energieeffizienz und Kosten.

Oct 29, 2025

240

NVIDIA präsentiert eine revolutionäre AI-Rechenzentrum-Design, um leistungsstarke Berechnungen zu unterstützen

Bei der GTC-Messe 2025 stellte NVIDIA das Designkonzept 'Omniverse DSX Blueprint' für gigawattgroße AI-Rechenzentren vor und bezeichnete es als 'AI-Fabrik'. Dieses Konzept basiert auf dem Omniverse-Framework und unterstützt verschiedene Größen von 100 Millionen bis 1 Milliarde Watt. Es soll die effiziente Ausbildung und Ausführung großer KI-Modelle ermöglichen und den wachsenden Anforderungen an KI-Berechnungen gerecht werden. Es handelt sich um einen wichtigen Fortschritt in der Infrastruktur für künstliche Intelligenz.

Oct 29, 2025

260

Die AI-Audio-Serie-Revolution bricht aus! Doubao präsentiert ein automatisches Mehrpersonen-Stimmen-System mit einer Erkennungspräzision von 98 %, die professionellen Hörspielen in nichts nachsteht

Das Doubao-Stimme-Team hat eine "automatisierte Produktion für AI-Mehrpersonen-Audio-Serien" vorgestellt, die die gesamte Produktionskette vom Roman-Text bis zum fertigen Hörspiel vollständig automatisiert. Keine Stimmenaufnahme, Schnitt oder menschliche Intervention erforderlich, was zu erheblichen Kosteneinsparungen und Effizienzsteigerungen führt. Das Ergebnis ist nahe an professionelles Niveau, wobei die Präzision der Rollenerkennung 98 % erreicht.

Oct 29, 2025

230

Ehemaliger Leiter der AI-Produkte bei ByteDance Jiansheng Liu gründet Unternehmen und stellt einen Marketing-Multimodal-Agent vor

Ehemaliger Leiter der AI-Produkte bei ByteDance, Liu Liaoqian, gründete das Unternehmen 'Extremes Kontext' und konzentriert sich auf die Entwicklung eines Marketing-Multimodal-Agents. Dank seiner reichen Erfahrung im Bereich AIGC schloss er schnell eine Finanzierungsrunde von mehreren Millionen Dollar ab. Liu Liaoqian arbeitete zuvor bei Tencent und ByteDance und beschäftigte sich seit 2019 mit AIGC-Technologien, was Aufmerksamkeit in der Branche erregte.

Oct 29, 2025

280

SoulX-Podcast-Modell der Soul-Sprachtechnologie: Schockierende Veröffentlichung des 90-minütigen ununterbrochenen Podcasts - AI-Sprachrevolution wird erneut verbessert

SoulX-Podcast, ein Sprachmodell für Podcasts, erzeugt hochrealistische Stimmen. Es unterstützt lange Dauer, mehrere Sprecher und Sprachen, mit durchgängiger Qualität über 90 Minuten.....

Oct 29, 2025

190

Google stellt AI-Marketing-Tool Pomelli vor: Automatisches Erstellen von Markeninhalten mit nur einer Webadresse

Google stellt Pomelli vor, ein KI-Marketingtool, das automatisch maßgeschneiderte Inhalte für Websites erstellt. Ideal für KMU, um digitale Marketinglösungen einfach zu nutzen.....

Oct 29, 2025

420

360 veröffentlicht den weltweit ersten L2-L4-Stack-Intelligenzplattform! Die AI-Umstellung für Regierung und Unternehmen erreicht eine Ära des „Out-of-the-box“-Betriebs

Die 360 Gruppe veröffentlichte eine unternehmensrelevante Intelligenzplattform und stellte das weltweit erste Intelligenz-Betriebssystem vor, das L2 bis L4 abdeckt. Zudem wurde die SEAF-Intelligenzfabrik aktualisiert. Die Plattform zielt darauf ab, Regierungen und Unternehmen mit einer einheitlichen AI-Lösung zu versorgen und die Implementierung der Industrieanpassung von "0 auf 1" zu "1 auf 10" zu fördern.

Oct 29, 2025

290

Huang Renxun widerspricht der Theorie des AI-Blasen, NVIDIA's neue Chips werden voraussichtlich 500 Milliarden Dollar Umsatz erzielen

Der CEO von NVIDIA, Huang Renxun, lehnte die Theorie des AI-Markt-Blasen auf der GTC-Konferenz in Washington ab und erwartet, dass die neuen Blackwell- und Rubin-Chips in den nächsten Quartalen 500 Milliarden Dollar Umsatz erzeugen werden und damit eine neue Wachstumsphase für das Unternehmen einleiten. Dies ist die erste GTC-Konferenz, die NVIDIA in der US-Hauptstadt veranstaltet.

Oct 29, 2025

230

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

AI Conversation Insight

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

Die Inferenzfähigkeit des TRM-Modells mit 7 Millionen Parametern übertrifft sogar Gemini 2.5 Pro und Claude 3.7

AIbase基地

Rekursive Schlussfolgerungsmechanismus: Enge korrigierende Schleifen

Forschungssinn und Grenzen

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

HYPERCLOUD stellt das erste interaktive AI-Podcast in China vor, bei dem Benutzer jederzeit Fragen stellen können

AI-Tageszeitung: Douyin veröffentlicht ein vollautomatisches System für Mehrpersonen-Sprechersysteme; Adobe Firefly Image 5 erhebliche Verbesserungen; Soul- Sprachmodell SoulX-Podcast wird vorgestellt

Qualcomm dringt in den Datenbank-Markt ein! Einführung der AI200/AI250-Chips mit Ziel Nvidia, Aktienkurs steigt um 20% an einem Tag

NVIDIA präsentiert eine revolutionäre AI-Rechenzentrum-Design, um leistungsstarke Berechnungen zu unterstützen

Die AI-Audio-Serie-Revolution bricht aus! Doubao präsentiert ein automatisches Mehrpersonen-Stimmen-System mit einer Erkennungspräzision von 98 %, die professionellen Hörspielen in nichts nachsteht

Ehemaliger Leiter der AI-Produkte bei ByteDance Jiansheng Liu gründet Unternehmen und stellt einen Marketing-Multimodal-Agent vor

SoulX-Podcast-Modell der Soul-Sprachtechnologie: Schockierende Veröffentlichung des 90-minütigen ununterbrochenen Podcasts - AI-Sprachrevolution wird erneut verbessert

Google stellt AI-Marketing-Tool Pomelli vor: Automatisches Erstellen von Markeninhalten mit nur einer Webadresse

360 veröffentlicht den weltweit ersten L2-L4-Stack-Intelligenzplattform! Die AI-Umstellung für Regierung und Unternehmen erreicht eine Ära des „Out-of-the-box“-Betriebs

Huang Renxun widerspricht der Theorie des AI-Blasen, NVIDIA's neue Chips werden voraussichtlich 500 Milliarden Dollar Umsatz erzielen

Empfohlene verwandte KI-Nachrichten

HYPERCLOUD stellt das erste interaktive AI-Podcast in China vor, bei dem Benutzer jederzeit Fragen stellen können

AI-Tageszeitung: Douyin veröffentlicht ein vollautomatisches System für Mehrpersonen-Sprechersysteme; Adobe Firefly Image 5 erhebliche Verbesserungen; Soul- Sprachmodell SoulX-Podcast wird vorgestellt

Qualcomm dringt in den Datenbank-Markt ein! Einführung der AI200/AI250-Chips mit Ziel Nvidia, Aktienkurs steigt um 20% an einem Tag

NVIDIA präsentiert eine revolutionäre AI-Rechenzentrum-Design, um leistungsstarke Berechnungen zu unterstützen

Die AI-Audio-Serie-Revolution bricht aus! Doubao präsentiert ein automatisches Mehrpersonen-Stimmen-System mit einer Erkennungspräzision von 98 %, die professionellen Hörspielen in nichts nachsteht

Ehemaliger Leiter der AI-Produkte bei ByteDance Jiansheng Liu gründet Unternehmen und stellt einen Marketing-Multimodal-Agent vor

SoulX-Podcast-Modell der Soul-Sprachtechnologie: Schockierende Veröffentlichung des 90-minütigen ununterbrochenen Podcasts - AI-Sprachrevolution wird erneut verbessert

Google stellt AI-Marketing-Tool Pomelli vor: Automatisches Erstellen von Markeninhalten mit nur einer Webadresse

360 veröffentlicht den weltweit ersten L2-L4-Stack-Intelligenzplattform! Die AI-Umstellung für Regierung und Unternehmen erreicht eine Ära des „Out-of-the-box“-Betriebs

Huang Renxun widerspricht der Theorie des AI-Blasen, NVIDIA's neue Chips werden voraussichtlich 500 Milliarden Dollar Umsatz erzielen