Liquid AI präsentiert Hyena Edge: Eine neue Ära für KI auf Smartphones und Edge-Geräten

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 5 Minuten Lesezeit · Apr 27, 2025

Liquid AI hat kürzlich vor der International Conference on Learning Representations (ICLR) 2025 sein neues Modell „Hyena Edge“ vorgestellt. Dies ist ein konvolutionäres Multi-Hybrid-Modell, das effizientere KI-Lösungen für Smartphones und andere Edge-Geräte bereitstellen soll. Das in Boston ansässige Unternehmen, hervorgegangen aus dem Massachusetts Institute of Technology (MIT), konzentriert sich darauf, die Transformer-Architektur zu übertreffen, auf der die meisten aktuellen großen Sprachmodelle (LLMs) basieren.

Hyena Edge zeichnet sich sowohl durch seine Rechenleistung als auch durch die Qualität seines Sprachmodells aus. Tests auf einem Samsung Galaxy S24 Ultra zeigten geringere Latenzzeiten, geringeren Speicherverbrauch und eine bessere Leistung in verschiedenen Benchmarks im Vergleich zum Transformer++-Modell mit vergleichbaren Parametern. Diese neue Architektur markiert einen neuen Meilenstein in der Edge-KI-Technologie.

Im Gegensatz zu den meisten kleinen Modellen, die für den mobilen Einsatz entwickelt wurden, verzichtet Hyena Edge auf das herkömmliche, rechenintensive Aufmerksamkeitsdesign. Stattdessen nutzt es die getakteten Faltungen der Hyena-Y-Serie, wodurch zwei Drittel der gruppierten Query-Attention (GQA)-Operationen ersetzt werden. Die Architektur von Hyena Edge basiert auf dem „Custom Architecture Synthesis“ (STAR)-Framework von Liquid AI, das mithilfe von Evolutionsalgorithmen die Modellstruktur automatisch optimiert, um mehrere hardwarespezifische Ziele wie Latenz, Speicherverbrauch und Modellqualität zu verbessern.

Um die praktische Anwendbarkeit von Hyena Edge zu überprüfen, führte Liquid AI Tests auf einem Samsung Galaxy S24 Ultra durch. Die Ergebnisse zeigten, dass das Modell bei längeren Sequenzen eine um 30 % schnellere Vorabfüllung und Dekodierung aufweist als Transformer++. Gleichzeitig war der Speicherverbrauch von Hyena Edge bei allen getesteten Sequenzlängen geringer als bei herkömmlichen Modellen, was es zur idealen Wahl für ressourcenbeschränkte Umgebungen macht.

In Benchmark-Tests wurde Hyena Edge mit 100 Milliarden Token trainiert und zeigte hervorragende Ergebnisse in verschiedenen Standard-Tests für kleine Sprachmodelle, darunter Wikitext, Lambada, PiQA, HellaSwag, Winogrande, ARC-easy und ARC-challenge. Besonders hervorzuheben sind die Verbesserungen beim Perplexity-Score bei Wikitext und Lambada sowie die gesteigerte Genauigkeit bei PiQA, HellaSwag und Winogrande.

Liquid AI plant außerdem, in den kommenden Monaten eine Reihe von Liquid-Basismodellen, darunter Hyena Edge, Open Source bereitzustellen. Ziel ist es, ein effizientes, universelles KI-System zu schaffen, das sich von Cloud-Rechenzentren bis hin zu persönlichen Edge-Geräten skalieren lässt. Der Erfolg von Hyena Edge liegt nicht nur in seinen hervorragenden Leistungsmerkmalen, sondern zeigt auch das Potenzial automatisierter Architekturdesigns und setzt neue Maßstäbe für die zukünftige, edge-optimierte KI.

Offizieller Blog: https://www.liquid.ai/research/convolutional-multi-hybrids-for-edge-devices

Highlights:
🌟 Hyena Edge ist ein neues konvolutionäres Modell von Liquid AI, speziell für Edge-Geräte wie Smartphones entwickelt.
🚀 Das Modell übertrifft traditionelle Transformer++-Modelle in Bezug auf Rechenleistung und Speicherverbrauch und eignet sich daher ideal für ressourcenbeschränkte Umgebungen.
📈 Hyena Edge erzielt hervorragende Ergebnisse in verschiedenen Standard-Benchmarks für Sprachmodelle und soll in Zukunft Open Source bereitgestellt werden, um die Verbreitung der Technologie zu fördern.

AWS plant eine zusätzliche Investition von 5 Milliarden Dollar in Südkorea, um den Aufbau von KI-Datenzentren voranzutreiben

AWS gab bekannt, in den nächsten sechs Jahren in Südkorea zusätzliche 5 Milliarden Dollar investieren zu wollen, um KI-Datenzentren auszubauen und mit der SK Gruppe ein großes Infrastrukturprojekt in Ulsan zu bauen. Die gesamte Investition in Südkorea wird insgesamt 12,6 Milliarden Dollar betragen und zeigt die strategische Bedeutung des südkoreanischen Marktes für AWS.

AI-Tageszeitung: Douyin veröffentlicht ein vollautomatisches System für Mehrpersonen-Sprechersysteme; Adobe Firefly Image 5 erhebliche Verbesserungen; Soul- Sprachmodell SoulX-Podcast wird vorgestellt

Das Sprachteam von Douyin stellt eine vollautomatische AI-Mehrpersonen-Hörspiel-Produktionsmethode vor, die Romane automatisch in Mehrpersonen-Sprecherspiele umwandeln kann. Die Genauigkeit der Rollenerkennung erreicht 98 % und ist mit dem Niveau professioneller Hörspiele vergleichbar, wodurch die Effizienz der Produktion von AI-Hörinhalten erheblich gesteigert wird.

Qualcomm dringt in den Datenbank-Markt ein! Einführung der AI200/AI250-Chips mit Ziel Nvidia, Aktienkurs steigt um 20% an einem Tag

Qualcomm hat zwei Cloud-AI-Inferring-Chips, AI200 und AI250, vorgestellt und plant deren kommerzielle Nutzung im Jahr 2026 bzw. 2027. Dies markiert den Übergang von Endgeräte-Chips zu einer vollständigen AI-Infrastruktur. Die Nachricht führte zu einem Anstieg des Aktienkurses um mehr als 20% an einem Tag und ist der größte Anstieg seit 2019. Im Gegensatz zur allseitigen Strategie von Nvidia konzentriert sich Qualcomm auf den Markt für große Modell-Inferring und betont die Vorteile der Energieeffizienz und Kosten.

NVIDIA präsentiert eine revolutionäre AI-Rechenzentrum-Design, um leistungsstarke Berechnungen zu unterstützen

Bei der GTC-Messe 2025 stellte NVIDIA das Designkonzept 'Omniverse DSX Blueprint' für gigawattgroße AI-Rechenzentren vor und bezeichnete es als 'AI-Fabrik'. Dieses Konzept basiert auf dem Omniverse-Framework und unterstützt verschiedene Größen von 100 Millionen bis 1 Milliarde Watt. Es soll die effiziente Ausbildung und Ausführung großer KI-Modelle ermöglichen und den wachsenden Anforderungen an KI-Berechnungen gerecht werden. Es handelt sich um einen wichtigen Fortschritt in der Infrastruktur für künstliche Intelligenz.

Die AI-Audio-Serie-Revolution bricht aus! Doubao präsentiert ein automatisches Mehrpersonen-Stimmen-System mit einer Erkennungspräzision von 98 %, die professionellen Hörspielen in nichts nachsteht

Das Doubao-Stimme-Team hat eine "automatisierte Produktion für AI-Mehrpersonen-Audio-Serien" vorgestellt, die die gesamte Produktionskette vom Roman-Text bis zum fertigen Hörspiel vollständig automatisiert. Keine Stimmenaufnahme, Schnitt oder menschliche Intervention erforderlich, was zu erheblichen Kosteneinsparungen und Effizienzsteigerungen führt. Das Ergebnis ist nahe an professionelles Niveau, wobei die Präzision der Rollenerkennung 98 % erreicht.

Ehemaliger Leiter der AI-Produkte bei ByteDance Jiansheng Liu gründet Unternehmen und stellt einen Marketing-Multimodal-Agent vor

Ehemaliger Leiter der AI-Produkte bei ByteDance, Liu Liaoqian, gründete das Unternehmen 'Extremes Kontext' und konzentriert sich auf die Entwicklung eines Marketing-Multimodal-Agents. Dank seiner reichen Erfahrung im Bereich AIGC schloss er schnell eine Finanzierungsrunde von mehreren Millionen Dollar ab. Liu Liaoqian arbeitete zuvor bei Tencent und ByteDance und beschäftigte sich seit 2019 mit AIGC-Technologien, was Aufmerksamkeit in der Branche erregte.

360 veröffentlicht den weltweit ersten L2-L4-Stack-Intelligenzplattform! Die AI-Umstellung für Regierung und Unternehmen erreicht eine Ära des „Out-of-the-box“-Betriebs

Die 360 Gruppe veröffentlichte eine unternehmensrelevante Intelligenzplattform und stellte das weltweit erste Intelligenz-Betriebssystem vor, das L2 bis L4 abdeckt. Zudem wurde die SEAF-Intelligenzfabrik aktualisiert. Die Plattform zielt darauf ab, Regierungen und Unternehmen mit einer einheitlichen AI-Lösung zu versorgen und die Implementierung der Industrieanpassung von "0 auf 1" zu "1 auf 10" zu fördern.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Ranking Monitor

AI Conversation Insight

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

LLM API Proxy Checker

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

Liquid AI präsentiert Hyena Edge: Eine neue Ära für KI auf Smartphones und Edge-Geräten

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

HYPERCLOUD stellt das erste interaktive AI-Podcast in China vor, bei dem Benutzer jederzeit Fragen stellen können

AWS plant eine zusätzliche Investition von 5 Milliarden Dollar in Südkorea, um den Aufbau von KI-Datenzentren voranzutreiben

AI-Tageszeitung: Douyin veröffentlicht ein vollautomatisches System für Mehrpersonen-Sprechersysteme; Adobe Firefly Image 5 erhebliche Verbesserungen; Soul- Sprachmodell SoulX-Podcast wird vorgestellt

Qualcomm dringt in den Datenbank-Markt ein! Einführung der AI200/AI250-Chips mit Ziel Nvidia, Aktienkurs steigt um 20% an einem Tag

NVIDIA präsentiert eine revolutionäre AI-Rechenzentrum-Design, um leistungsstarke Berechnungen zu unterstützen

Die AI-Audio-Serie-Revolution bricht aus! Doubao präsentiert ein automatisches Mehrpersonen-Stimmen-System mit einer Erkennungspräzision von 98 %, die professionellen Hörspielen in nichts nachsteht

Ehemaliger Leiter der AI-Produkte bei ByteDance Jiansheng Liu gründet Unternehmen und stellt einen Marketing-Multimodal-Agent vor

SoulX-Podcast-Modell der Soul-Sprachtechnologie: Schockierende Veröffentlichung des 90-minütigen ununterbrochenen Podcasts - AI-Sprachrevolution wird erneut verbessert

Google stellt AI-Marketing-Tool Pomelli vor: Automatisches Erstellen von Markeninhalten mit nur einer Webadresse

360 veröffentlicht den weltweit ersten L2-L4-Stack-Intelligenzplattform! Die AI-Umstellung für Regierung und Unternehmen erreicht eine Ära des „Out-of-the-box“-Betriebs

Empfohlene verwandte KI-Nachrichten

HYPERCLOUD stellt das erste interaktive AI-Podcast in China vor, bei dem Benutzer jederzeit Fragen stellen können

AWS plant eine zusätzliche Investition von 5 Milliarden Dollar in Südkorea, um den Aufbau von KI-Datenzentren voranzutreiben

AI-Tageszeitung: Douyin veröffentlicht ein vollautomatisches System für Mehrpersonen-Sprechersysteme; Adobe Firefly Image 5 erhebliche Verbesserungen; Soul- Sprachmodell SoulX-Podcast wird vorgestellt

Qualcomm dringt in den Datenbank-Markt ein! Einführung der AI200/AI250-Chips mit Ziel Nvidia, Aktienkurs steigt um 20% an einem Tag

NVIDIA präsentiert eine revolutionäre AI-Rechenzentrum-Design, um leistungsstarke Berechnungen zu unterstützen

Die AI-Audio-Serie-Revolution bricht aus! Doubao präsentiert ein automatisches Mehrpersonen-Stimmen-System mit einer Erkennungspräzision von 98 %, die professionellen Hörspielen in nichts nachsteht

Ehemaliger Leiter der AI-Produkte bei ByteDance Jiansheng Liu gründet Unternehmen und stellt einen Marketing-Multimodal-Agent vor

SoulX-Podcast-Modell der Soul-Sprachtechnologie: Schockierende Veröffentlichung des 90-minütigen ununterbrochenen Podcasts - AI-Sprachrevolution wird erneut verbessert

Google stellt AI-Marketing-Tool Pomelli vor: Automatisches Erstellen von Markeninhalten mit nur einer Webadresse

360 veröffentlicht den weltweit ersten L2-L4-Stack-Intelligenzplattform! Die AI-Umstellung für Regierung und Unternehmen erreicht eine Ära des „Out-of-the-box“-Betriebs