UCLA präsentiert MultiPLY AI: Das erste multimodale, verkörperte KI-Modell mit menschenähnlichen Sinnen

站长之家

Veröffentlicht amKI-Nachrichten und -Informationen · 2 Minuten Lesezeit · Jan 22, 2024

MultiPLY: Ein neues, gekörpert intelligentes großes Sprachmodell

Forscher der UCLA und anderer Institutionen haben kürzlich MultiPLY vorgestellt, ein großes Sprachmodell mit verkörperter Intelligenz. Dieses Modell verfügt über multimodale Wahrnehmungsfähigkeiten, einschließlich Berührung, Sehen und Hören, wodurch die KI umfassender mit 3D-Umgebungen interagieren kann.

Durch die Interaktion des Agenten mit der 3D-Umgebung zeigt MultiPLY hervorragende Leistungen in Experimenten zu Objektabruf, Werkzeuggebrauch, multisensorischer Annotation und Aufgabenzerlegung. Zusätzlich haben die Forscher einen umfangreichen multisensorischen Datensatz namens Multisensory-Universe mit 500.000 Datensätzen erstellt.

Diese Forschung liefert neue Ansätze für den Aufbau großer Modelle mit multisensorischen Fähigkeiten und eröffnet neue Wege zur Erreichung von AGI (Artificial General Intelligence).

MultiPLY KI UCLA

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe

Empfohlene verwandte KI-Nachrichten

Google stellt eine neue KI-Intelligenz-Anruffunktion vor, um leicht Geschäftsinformationen zu erhalten und keine Sorgen mehr zu haben!

Google führt KI-Wählfunktion ein, die für Nutzer bei Unternehmen anruft. Die KI fragt zuerst nach Bedürfnissen, teilt dem Unternehmen den Roboteranruf mit. Zudem wurde die Such-KI mit Gemini2.5Pro für komplexe Fragen und "Tiefensuche" für detaillierte Berichte aktualisiert.....

Jul 17, 2025

Grok's KI-Partner löst Kontroversen aus und wird im Apple App Store als 12-jährig bewertet

xAI-Chatbot Grok fügt umstrittene 3D-Avatare hinzu: Ein Panda, der zu Straftaten anstiftet, und ein Mädchen mit sexuellen Andeutungen. Verstößt gegen App Store-Richtlinien, aber als 12+ eingestuft. Wirft Fragen zur KI-Regulierung auf.....

Jul 17, 2025

Google führt in Discover KI-Nachrichtenzusammenfassungen ein – die Medienbranche leidet erneut unter dem Verlust von Traffic

Google hat auf der Plattform Discover offiziell eine Funktion zur KI-gestützten Nachrichtenzusammenfassung eingeführt, was Besorgnis in der Medienbranche über den Verlust von Traffic auslöst. Diese Funktion ist bereits für iOS- und Android-Nutzer in den USA verfügbar und ersetzt traditionelle Nachrichtentitel und Quellenbezeichnungen durch drei Zeilen KI-Zusammenfassungen. Sie umfasst vor allem beliebte Themen wie Sport und Unterhaltung. Die Zusammenfassungen zeigen die Anzahl der Quellen an und warnen vor möglichen Fehlern. Doch die Medienbranche befürchtet, dass dies das Phänomen Google Zero verstärken könnte – Nutzer erhalten Informationen ohne auf den Originaltext klicken zu müssen, was zu einem Rückgang des Webtraffic und der Werbeeinnahmen führt. Vorher hatte Google bereits in Suchergebnissen...

Jul 17, 2025

ChatExcel neue Desktop-Version ist verfügbar: KI-Intelligenz-Vorschlagsfunktion unterstützt die Datenverarbeitung

ChatExcel bietet eine Desktop-Version an, die Mac- und Windows-Systeme unterstützt und lokale Excel-Verarbeitung ermöglicht, um die Arbeitsleistung zu steigern. Es wurde eine neue KI-Vorschlagsoptimierungsfunktion hinzugefügt, die mit dem Zauberstift Anweisungen automatisch standardisiert und das Speichern häufig verwendeter Vorschläge zur Wiederverwendung unterstützt. Derzeit haben mehr als eine Million Nutzer das Produkt, und es wird wöchentlich aktualisiert, um die Benutzererfahrung kontinuierlich zu verbessern. Besondere Merkmale: 1) Browser-unabhängige Nutzung auf Desktop; 2) intelligente Optimierung der KI-Interaktionsvorschläge; 3) Funktion zum Speichern beliebter Vorschläge.

Jul 17, 2025

Kimi-2 ist auf LiveBench AI verfügbar: Ein neuer offener KI-Weltmeister übertrifft GPT-4.1

Kimi-2, ein Open-Source-Modell mit 32B Parametern, übertrifft Claude Opus4 und GPT-4.1. Preisgünstige API für 0,15$/Mio Tokens. Jetzt in Kimi-App verfügbar.....

Jul 16, 2025

Huang Renxun erscheint auf der Blockchain-Expo: KI wird zur globalen Neubauinfrastruktur, chinesische Entwickler spielen eine entscheidende Rolle

NVIDIA-CEO Jensen Huang betont Chinas Rolle in der KI-Entwicklung: 1,5 Mio. lokale Projekte, Open-Source-Beiträge und digitale Lieferketten-Transformation via Omniverse-Plattform. KI als Treiber der nächsten industriellen Revolution.....

Jul 16, 2025

Neues Unternehmen von ehemaligem CTO von OpenAI, Mira Murati, hat 2 Milliarden US-Dollar Finanzierung abgeschlossen und fördert die Entwicklung von multimodalen KI

OpenAI Ex-CTO Mira Muratis Thinking Machines Lab sammelte 2 Mrd. $ Seed-Finanzierung (Bewertung: 12 Mrd. $), Rekord in der KI-Branche. Das SF-basierte Unternehmen entwickelt multimodale KI-Systeme für natürliche Interaktion und plant Open-Source-Komponenten.....

Jul 16, 2025

5 Stunden im verlorenen Wald ChatGPT rettet die Situation! Echtes Beispiel für KI-Navigation!

Jul 16, 2025

Neue Trend in der Nachbarschaftssozialisation! Nextdoor lanciert KI-Empfehlungen und Echtzeit-Warnungen, um die lokale Kommunikation neu zu definieren

Die Nachbarschafts-Sozialanwendung Nextdoor hat eine neue Version veröffentlicht und fügt drei Funktionen hinzu: Lokale Nachrichtenaggregation (in Zusammenarbeit mit 3500 lokalen Medien), Echtzeit-Sicherheitswarnungen (Wetter/Verkehr/Naturkatastrophen) und KI-Empfehlungen Faves (persönliche lokale Dienstleistungsvorschläge basierend auf 15 Jahren Nachbarschaftsdaten). Die Plattform zielt darauf ab, das Problem falscher Informationen zu lösen und die Nutzerbeteiligung durch Verbesserung der Inhaltqualität und -aktualität erneut zu steigern. Der CEO Toria betont, dass der Kernvorteil darin besteht, digitale Nachbarschaftsempfehlungen zu bieten, was ein einzigartiger Wert ist, den andere Plattformen nicht nachahmen können.

Jul 16, 2025

Mistral stellt Voxtral vor: Das neue Zeitalter der offenen KI-Audiosysteme beginnt!

Mistral veröffentlicht Open-Source-Audio-Modell Voxtral mit drei Versionen für verschiedene Anwendungen. Unterstützt 30 Min. Transkription, 40 Min. Inhaltsverständnis und Mehrsprachigkeit. API ab 0,001$/Min, günstiger als Whisper. Teil von Mistrals Open-Source-Strategie.....

Jul 16, 2025

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

UCLA präsentiert MultiPLY AI: Das erste multimodale, verkörperte KI-Modell mit menschenähnlichen Sinnen

站长之家

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

Google stellt eine neue KI-Intelligenz-Anruffunktion vor, um leicht Geschäftsinformationen zu erhalten und keine Sorgen mehr zu haben!

Grok's KI-Partner löst Kontroversen aus und wird im Apple App Store als 12-jährig bewertet

Google führt in Discover KI-Nachrichtenzusammenfassungen ein – die Medienbranche leidet erneut unter dem Verlust von Traffic

ChatExcel neue Desktop-Version ist verfügbar: KI-Intelligenz-Vorschlagsfunktion unterstützt die Datenverarbeitung

Kimi-2 ist auf LiveBench AI verfügbar: Ein neuer offener KI-Weltmeister übertrifft GPT-4.1

Huang Renxun erscheint auf der Blockchain-Expo: KI wird zur globalen Neubauinfrastruktur, chinesische Entwickler spielen eine entscheidende Rolle

Neues Unternehmen von ehemaligem CTO von OpenAI, Mira Murati, hat 2 Milliarden US-Dollar Finanzierung abgeschlossen und fördert die Entwicklung von multimodalen KI

5 Stunden im verlorenen Wald ChatGPT rettet die Situation! Echtes Beispiel für KI-Navigation!

Neue Trend in der Nachbarschaftssozialisation! Nextdoor lanciert KI-Empfehlungen und Echtzeit-Warnungen, um die lokale Kommunikation neu zu definieren

Mistral stellt Voxtral vor: Das neue Zeitalter der offenen KI-Audiosysteme beginnt!