Willkommen in der Rubrik 【AI-Tageszeitung】! Hier ist das Leitfaden für jeden, der sich täglich mit der Welt der künstlichen Intelligenz erkunden möchte. Jeden Tag präsentieren wir Ihnen spannende Neuigkeiten aus dem AI-Bereich und konzentrieren uns dabei auf Entwickler, um Ihnen Trends zu verdeutlichen und innovative Anwendungen von AI-Produkten vorzustellen.

Frische AI-Produkte Jetzt entdecken: https://top.aibase.com/

1. Kein Einladungscode erforderlich! Der nationale AI-Agent Manus öffnet sich für alle Nutzer.

Der nationale AI-Agent-Plattform Manus hat kürzlich die Benutzerregistrierung geöffnet, ohne Wartezeiten. Nutzer können sich direkt registrieren und erhalten dabei Bonuspunkte. Die Plattform wurde von der Firma Monica entwickelt und erfreut sich schnell großer Beliebtheit durch die einzigartige Attraktivität seines universellen AI-Agenten. Durch innovative technische Architektur vereint Manus Denken und Handeln, wodurch die kreative Potenziale der Nutzer enorm gesteigert werden und vielfältige Aufgaben in verschiedenen Bereichen abgedeckt werden – dies markiert eine Umwandlung in der AI-Anwendung.

image.png

【AiBase Zusammenfassung:】

🚀 Die Plattform Manus ist jetzt für Registrierungen offen, und Nutzer können täglich kostenlose Aufgaben ausführen und Punkte erhalten.

🤖 Durch technologische Innovation vereint Manus Denken und Handeln und unterstützt komplexe Aufgaben.

🌐 Zusammenarbeit mit dem Team von Tongyi Qianwen von Alibaba, um die Anwendung nationaler Modelle und Rechenplattformen zu verbessern und das Nutzererlebnis zu steigern.

2. Das weltweit erste Design-Agent Lovart im Beta-Test! Mit einem Satz Logo, Video und gesamtes Markenpaket fertigstellen

Die Firma Lovart AI hat das weltweit erste Design-Agent vorgestellt, das Bild-, Video- und Musikmodelle integriert und traditionelle Designprozesse revolutioniert. Nutzer können komplexe Aufgaben durch natürliche Sprachbefehle automatisiert ausführen und werden von Designern und Gründerunternehmen stark beachtet. Kernfunktionen wie Aufgabenzerlegung, multimodale Inhaltserstellung und intelligente Text-Bild-Separation erhöhen die Produktivität extrem. Lovart hat in der Beta-Version herausragende Ergebnisse geliefert und wird die Entwicklung von AI-Design-Werkzeugen weiter vorantreiben.

image.png

【AiBase Zusammenfassung:】

🛠️ Lovart AI ermöglicht durch natürliche Sprachbefehle vollständige Automatisierung des Designs, wobei Nutzer nur einen Satz benötigen, um komplexe Aufgaben auszuführen.

🎥 Unterstützung für multimodale Modellintegration, Nutzer können leicht Bilder, Videos und Musik generieren und die Kreativität erhöhen.

🌐 Lovart hat in der Beta-Version großes Interesse gefunden und Nutzer loben die Produktivitätssteigerung von über 500%, was ein starkes Marktangebot zeigt.

Mehr Informationen unter: https://lovart.ai

3. Das Bildungswesen zieht Grenzen für AI-Gebrauch: Phasenweise Einführung in der Grundschule bis zur Sekundarstufe einschränkt Kopieren von AI-Antworten.

Die von der chinesischen Bildungsministerium veröffentlichten Richtlinien "Allgemeine Bildung in KI für Schüler (Version 2025)" und "Richtlinien für den Gebrauch generativer KI für Schüler (Version 2025)" legen klare Regeln für den Einsatz von KI im Bildungsbereich fest und betonen, dass Schüler keine AI-generierten Inhalte als Hausaufgaben oder Prüfungsentwürfe verwenden dürfen, um Unabhängigkeit im Denken zu fördern. Gleichzeitig schlagen diese Richtlinien für jede Schulstufe spezifische Strategien vor und betonen die Verantwortung der Lehrkräfte, um sicherzustellen, dass Schüler in einer sicheren Umgebung KI-Tools verantwortungsvoll nutzen.

image.png

【AiBase Zusammenfassung:】

🚫 Es ist verboten, Schüler direkt AI-generierte Inhalte als Hausaufgaben oder Prüfungen zu verwenden, um unabhängiges Denken zu fördern.

👩‍🏫 Lehrkräfte sollen Schüler antrainieren, kritische Denkfähigkeiten zu entwickeln und logische Defizite und kulturelle Bias in AI-Texten zu analysieren.

🔒 Ein weißes Listen-System für AI-Tools wird eingeführt, um sicherzustellen, dass in Schulen verwendete AI-Tools den Bildungsbedarf und datenschutzkonforme Vorschriften erfüllen.

4. Von Bildern ausgehend interaktive Welten erstellen! Kunlun Weiwei öffnet Matrix-Game.

Die Gruppe Kunlun Weiwei hat am 13. Mai die Open-Source-Launch von Matrix-Game, einem fortschrittlichen Modell, das sich auf die Erstellung interaktiver Welten konzentriert, angekündigt. Dies markiert einen neuen Durchbruch in der Technologie dieses Bereichs. Nicht nur ist Matrix-Game der erste öffentlich verfügbare 10B+-Raumintelligenzmodell der Industrie, sondern es erreicht außerdem hohe Qualität und genaue Kontrolle durch seine drei Kernkomponenten.

image.png

【AiBase Zusammenfassung:】

🛠️ Matrix-Game ist das erste öffentlich verfügbare 10B+-Raumintelligenzmodell und konzentriert sich auf die Erstellung interaktiver Welten, setzt somit die technologischen Grenzen neu.

📊 Das Modell quantifiziert die Leistung von vier Dimensionen (visuelle Qualität, zeitliche Qualität usw.) durch das GameWorld Score-Evaluierungssystem und übertrifft bestehende Basismodelle.

🌍 Matrix-Game hat eine Vielzahl von Szenarien generalisiert und unterstützt verschiedene Landschaften und Umgebungen, um das Nutzerinteraktionserlebnis zu steigern.

Mehr Informationen unter: https://matrix-game-homepage.github.io

5. Download-Anzahl von Google's Gemma AI-Modell überschreitet 150 Millionen.

Google hat kürzlich bekannt gegeben, dass die Download-Anzahl seiner Gemma-KI-Modellsammlung die Marke von 150 Millionen überschritten hat, was ein Zeichen für bedeutenden Fortschritt in der KI-Branche darstellt. Gemma ist ein multimodales Modell, das Text und Bilder verarbeiten kann und mehr als 100 Sprachen unterstützt, um die Bedürfnisse globaler Nutzer zu erfüllen. Trotz der beeindruckenden Download-Zahlen bleibt sie jedoch hinter dem Rivalen Llama mit 1,2 Milliarden Downloads zurück und wird wegen komplexer Lizenzbedingungen von Entwicklern kritisiert.

image.png

【AiBase Zusammenfassung:】

🌟 Die Download-Anzahl hat die 150-Millionen-Marke überschritten: Die Gemma-KI-Modellsammlung von Google hat viele Entwickler interessiert und zeigt bedeutenden Fortschritt.

🖼️ Multimodale Funktionen: Gemma verarbeitet Text und Bilder und kann über 100 Sprachen unterstützen, um globale Nutzerbedürfnisse zu decken.

⚠️ Lizenzbedingungen kontrovers: Gemma und Llama werden wegen komplexer Lizenzbedingungen kritisiert, und Entwickler befürchten Risiken bei kommerzieller Nutzung.

6. OpenAI fügt neue PDF-Ausgabe-Funktion für Tiefenforschungsberichte hinzu.

OpenAI hat kürzlich eine neue Funktion hinzugefügt, die es Nutzern ermöglicht, ihre tiefen Forschungsberichte mit einem Klick als PDF-Datei zu exportieren. Diese Aktualisierung hebt die Praktikabilität und die Effizienz der Teilen enorm. Besonders in Unternehmen erleichtert dies die Erstellung professioneller Dokumente mit Zitaten, Tabellen und Bildern, um bessere Entscheidungen und Kommunikation zu unterstützen.

image.png

【AiBase Zusammenfassung:】

📝 Die neue PDF-Ausgabefunktion ermöglicht es Nutzern, komplett formatierte Tiefenforschungsberichte mit einem Klick zu erstellen und erhöht die Teilausbeute.

🔗 Die Funktion unterstützt sowohl neue als auch historische Berichte, sodass Nutzer ihre bereits vorhandenen Ergebnisse jederzeit abrufen können, was die Praktikabilität steigert.

🚀 OpenAI bringt diese Aktualisierung mit neuester KI-Technologie und bestehenden Unternehmensprozessen nahtlos zusammen und beschleunigt die Praktikabilität von KI-Werkzeugen.

7. ByteDance veröffentlicht den einheitlichen Bildpersonalisierungsrahmen DreamO: Integration von Kleiderwechseln, Gesichtsänderungen und Stiltransfer.

ByteDance hat auf der Plattform Hugging Face den DreamO vorgestellt, einen neuen Rahmen, der verschiedene Bildbearbeitungsfunktionen integriert. Dies markiert einen bedeutenden Durchbruch in der KI-basierten Bildbearbeitungstechnologie. DreamO bietet nicht nur Kleiderwechsel, Gesichtsänderungen und Stiltransfer, sondern zieht auch durch seine Open-Source-Natur Entwickler an, um Innovationen voranzutreiben. Seine einfache Lösung senkt die Einarbeitungshürde, sodass professionelle Designer und normale Nutzer hochwertige Bildbearbeitung einfach realisieren können.

image.png

【AiBase Zusammenfassung:】

✨ DreamO ist ein einheitlicher Rahmen, der verschiedene Funktionen wie Bildkleiderwechsel, Gesichtsänderungen und Stiltransfer integriert und vielseitige Bildbearbeitungsanforderungen abdeckt.

🔧 Durch flexible Parametersteuerung können Nutzer präzise Bildbearbeitungen durchführen und die Einarbeitungshürde senken, sodass sie für alle Nutzer geeignet ist.

🌍 Die Open-Source-Natur von DreamO fördert die Beteiligung globaler Entwickler und treibt Innovationen und Anwendungen im Bereich KI-basierter Bildbearbeitung voran.

Mehr Informationen unter: https://github.com/bytedance/DreamO

8. Kimi von Moonlight Shadows bekommt ein Update: Optimierung der Blasen-UI, Wechsel zu einem grenzenlosen Inhaltsgestaltung.

Die intelligente Assistenten-KI Kimi von Moonlight Shadows Technologies hat eine wesentliche UI-Upgrade erhalten, um das Nutzererlebnis und die Informationspräsentation zu verbessern. Diese Aktualisierung führt mehrere modale Container ein, die Realtime-Kursgraphiken, HTML-Vorschau und Sprachübertragung unterstützen, was die Interaktion zwischen Nutzern und Kimi erhöht. Obwohl die neue UI einige Nutzer an die alte Erinnerung erinnert, betont die Firma dies als Teil von Kimis Wachstum und hofft, dass diese Aktualisierungen ihn zu einem noch stärkeren intelligenten Assistenten machen.

image.png

【AiBase Zusammenfassung:】

📈 Kimi unterstützt Realtime-Kursgraphiken und bietet intuitive Marktbewegungsanalyse.

🎤 Neues Feature: Sprachübertragung, um Nutzer mit Informationen zu versorgen.

🔧 Nutzer können den Status von Kimis Diensten in Echtzeit überprüfen, was die Transparenz des Systems erhöht.

9. Alibaba MNN macht einen großen Sprung! Mobile Open-Source-Multi-Modal AI unterstützt Qwen-2.5, Text, Bild und Sprache im Griff!

Das Projekt MNN von Alibaba hat die neue Version MnnLlmApp veröffentlicht, die Qwen-2.5-Omni-3B und -7B-Modelle unterstützt und die Fähigkeit der mobilen Multi-Modal-AI enorm steigert. Diese App unterstützt eine Vielzahl von Modaltätigkeiten, einschließlich Generierung und Erkennung von Text, Bild und Audio, und zeichnet sich durch hohe Effizienz und geringe Ressourcenverbrauch aus, was die Aufmerksamkeit von Entwicklern erregt.

image.png

【AiBase Zusammenfassung:】

🛠️ Neue Version von MnnLlmApp integriert Qwen-2.5-Omni-3B und -7B-Modelle und unterstützt Multi-Modal-Aufgaben wie Text, Bild und Audio, was die Gesamtverarbeitungskapazität erhöht.

📱 Die App funktioniert vollständig lokal, ohne Internetverbindung, um Datenschutz zu gewährleisten und eine herausragende CPU-Inferenzleistung zu erreichen, die deutlich besser als vergleichbare Produkte ist.

🌐 Die Open-Source-Natur von MNN und deren Unterstützung für beliebte Modelle machen sie zur idealen Plattform für mobile Multi-Modal-AI-Entwicklung und schieben die Branche weiter voran.

Mehr Informationen unter: https://github.com/alibaba/MNN/blob/master/apps/Android/MnnLlmChat/README.md