Willkommen bei der Rubrik „AI-Tagesbericht“! Hier finden Sie Ihren täglichen Leitfaden zur Erkundung der Welt der künstlichen Intelligenz. Täglich präsentieren wir Ihnen die wichtigsten Themen aus dem Bereich KI, mit Fokus auf Entwickler, um Ihnen zu helfen, Technologietrends zu erkennen und innovative KI-Produktanwendungen kennenzulernen.

Neue KI-Produkte hier entdecken: https://top.aibase.com/

1. Fish Speech: Ein Open-Source-Text-to-Speech-Modell mit geringem Speicherbedarf, vergleichbar mit GPT-SoVITS

Fish Speech ist ein von fishaudio entwickeltes, neues Text-to-Speech-Tool, das drei Sprachen unterstützt: Chinesisch, Englisch und Japanisch. Die Sprachverarbeitung erreicht nahezu menschliches Niveau. Es verwendet den Flash-Attn-Algorithmus zur Verarbeitung großer Datenmengen und bietet ein effizientes, präzises und stabiles TTS-Erlebnis.

【AiBase-Zusammenfassung:】

😊 Perfekte Unterstützung für Chinesisch, Englisch und Japanisch, Sprachverarbeitung auf nahezu menschlichem Niveau

😊 Unterstützt Sprachklonierung: Mit nur einer Referenzsprachaufnahme kann schnell ein Klon erstellt werden.

😊 Sehr geringer Speicherbedarf: Nur 4 GB erforderlich, unterstützt verschiedene Sprachgenerierungsmodelle.

Online-Demo: https://top.aibase.com/tool/fish-audiowenbenzhuanyuyin

Details hier: https://www.aibase.com/news/9979

2. Meta 3D Gen veröffentlicht: Schnelle 3D-Asset-Generierung aus Text in unter einer Minute

Forscher haben kürzlich die neue Technologie Meta3D Gen (3DGen) veröffentlicht, die die schnelle Generierung von 3D-Assets aus Text in weniger als einer Minute ermöglicht und Benutzern qualitativ hochwertige Texturen und Materialien bietet. Die Technologie integriert Meta3D AssetGen und Meta3D TextureGen und bietet eine effiziente Methode zur Erstellung von 3D-Modellen, die drei- bis zehnmal schneller ist als bestehende Lösungen.

image.png

【AiBase-Zusammenfassung:】

🚀 Das Meta 3D Gen-System erstellt in weniger als einer Minute hochwertige 3D-Assets.

💡 Meta3D Gen integriert die beiden Kerntechnologien Meta3D AssetGen und Meta3DTextureGen.

✨ AssetGen unterstützt die Generierung von physikalisch basierten Materialien mit realistischen Beleuchtungs- und Schatteneffekten.

Detaillierte Informationen: https://ai.meta.com/research/publications/meta-3d-gen/

3. Microsoft veröffentlicht GraphRAG: Aufbau von Wissensgraphen zur Verbesserung der Fähigkeiten großer Sprachmodelle in Fragenbeantwortung und Inferenz

Das kürzlich von Microsoft veröffentlichte Open-Source-System GraphRAG nutzt Entitäts-Wissensgraphen, um die Fähigkeiten großer Sprachmodelle in den Bereichen Suche, Fragenbeantwortung, Zusammenfassung und Inferenz zu verbessern, insbesondere bei der Verarbeitung großer Datensätze. Durch den Aufbau eines globalen Entitäts-Wissensgraphen kann GraphRAG komplexe Beziehungen und Interaktionen in Texten erfassen und die Genauigkeit und Vollständigkeit der Suche verbessern. Darüber hinaus hat GraphRAG einen geringen Token-Bedarf, wodurch Entwicklungskosten gespart werden. In umfassenden Tests zeigte es hervorragende Ergebnisse und ist eine der derzeit besten RAG-Methoden.

【AiBase-Zusammenfassung:】

💡 GraphRAG verbessert die Fähigkeiten großer Sprachmodelle in Suche, Fragenbeantwortung, Zusammenfassung und Inferenz durch den Aufbau von Entitäts-Wissensgraphen, besonders bei großen Datensätzen.

💡 Das Kernstück von GraphRAG besteht aus zwei Schritten: dem Aufbau eines Entitäts-Wissensgraphen und der Generierung von Community-Zusammenfassungen. Durch Community-Zusammenfassungen werden relevante Informationen aus dem Datensatz extrahiert, um umfassendere und genauere Antworten zu generieren.

💡 GraphRAG hat einen geringen Token-Bedarf, was Entwicklern Kosten spart. In umfassenden Tests erzielte es hervorragende Ergebnisse und ist eine der derzeit besten RAG-Methoden.

Detaillierte Informationen: https://top.aibase.com/tool/graphrag

4. Microsoft bringt Design-Tool Designer heraus: Personalisierte Grußkarten mit einem Satz generieren

Die neue „Grußkarten“-Funktion von Microsoft Designer bietet Benutzern ein noch nie dagewesenes Erlebnis bei der Erstellung personalisierter Grußkarten und zeigt die praktische Anwendung von KI-Technologie im Alltag.

image.png

【AiBase-Zusammenfassung:】

🎨 Text-zu-Design: Benutzer geben eine einfache Beschreibung ein, die KI wandelt sie in ein einzigartiges Grußkartendesign um.

🖼️ KI-generierte Bilder: Die Inspiration für das Grußkartendesign stammt von der Benutzerbeschreibung und wird von der KI in ein detailliertes Bild umgewandelt.

✏️ Bearbeitbarer Inhalt: Die Innenseite der Grußkarte bietet bearbeitbaren Text, um die individuellen Bedürfnisse der Benutzer zu erfüllen.

Detaillierte Informationen: https://designer.microsoft.com/

5. Tencent Translation Intelligence Agent Company TRANSAGENTS geht online

TRANSAGENTS ist ein von Tencent AI Lab entwickeltes, auf literarische Übersetzungen spezialisiertes Multi-Agent-System, das die Zusammenarbeit virtueller Charaktere eines echten Übersetzungsbüros simuliert, um flüssige und effiziente Übersetzungen literarischer Werke zu ermöglichen. Die Kosten für literarische Übersetzungen mit TRANSAGENTS sind 80-mal niedriger als bei professionellen menschlichen Übersetzern, und bei Bedarf an fachspezifischem Wissen übertrifft es menschliche Übersetzungen. Diese Plattform zeigt das Potenzial der KI-Technologie im Bereich der Literaturübersetzung und bietet neue Möglichkeiten für die literarische Gestaltung und Verbreitung.

image.png

【AiBase-Zusammenfassung:】

🔑 TRANSAGENTS ist ein Multi-Agent-System für virtuelle Übersetzungs- und Verlagsunternehmen, speziell für sehr lange literarische Texte konzipiert und simuliert die Zusammenarbeit von Rollen in einem echten Übersetzungsbüro.

💰 Die Kosten für literarische Übersetzungen mit TRANSAGENTS sind 80-mal niedriger als bei professionellen menschlichen Übersetzern, wodurch die Übersetzungskosten gesenkt und die Verbreitung hochwertiger literarischer Werke gefördert werden.

🌟 TRANSAGENTS übertrifft bei Bedarf an fachspezifischem Wissen menschliche Übersetzungen und wird von menschlichen Bewertern und fortschrittlichen Sprachmodellen bevorzugt.

Detaillierte Informationen: https://top.aibase.com/tool/transagents

6. Suno veröffentlicht iOS-Client: Unterstützung für die Sprachgenerierung von Musik

Die von Suno veröffentlichte iOS-App verwandelt das Smartphone in ein virtuelles Musikstudio, leitet eine Revolution in der Musikproduktion ein und könnte die kreative Ausdrucksweise im digitalen Zeitalter verändern. Trotz rechtlicher Herausforderungen wird behauptet, dass die Technologie darauf abzielt, neue Werke zu generieren. Die iOS-App von Suno stellt einen wichtigen Schritt für die breite Öffentlichkeit dar und prägt die Zukunft der Musikbranche.

【AiBase-Zusammenfassung:】

🎵 Musikstudio auf dem Smartphone: Benutzer können mit Texteingaben oder Gesang vollständige Songs generieren, die verschiedene Musikstile erfüllen.

⚖️ Rechtliche Herausforderungen und Standfestigkeit: Angesichts von Klagen von Plattenfirmen wird darauf bestanden, dass die KI neue Werke generiert. Das Ergebnis des Rechtsstreits könnte die Entwicklung der KI-Musikindustrie beeinflussen.

🔮 Ausblick auf die Zukunft der KI-Musik: Die Grenzen zwischen KI und menschlicher Musikproduktion verschwimmen, was zu tiefgreifenden Fragen über Kreativität und die Zukunft der Musikindustrie führt.

7. Apple-Manager tritt dem OpenAI-Vorstand als Beobachter bei

Dieser Artikel berichtet über die Nachricht, dass der Apple-Manager Phil Schiller dem OpenAI-Vorstand als Beobachter beigetreten ist. Dies wird Apple einen besseren Einblick in die internen Abläufe von OpenAI ermöglichen und die Integration von ChatGPT in iOS und macOS sowie die Verbesserung der Intelligenz von Siri ermöglichen. Die Beteiligung von Microsoft am OpenAI-Vorstand verkompliziert die Partnerschaft.

【AiBase-Zusammenfassung:】

🍏 Der Apple-Manager Phil Schiller ist dem OpenAI-Vorstand als Beobachter beigetreten, um das Verständnis von OpenAI zu vertiefen.

🤖 Schillers Beitritt zum Vorstand wird die Integration von ChatGPT in iOS und macOS und die Verbesserung der Intelligenz von Siri fördern.

🔗 Microsoft ist ebenfalls als nicht stimmberechtigter Beobachter dem OpenAI-Vorstand beigetreten, was den OpenAI-Vorstand komplexer macht.

8. Von KI generiertes Video von Pandas, die Nudeln essen, erhält über 420.000 Likes auf Douyin – Nutzer sind begeistert von der Realitätsnähe

Kürzlich erreichte die KI-generierte Videotechnologie auf Douyin ein neues Niveau. Videos von Pandas und Katzen, die mit Stäbchen Nudeln essen, sind kaum zu glauben. Obwohl es noch Mängel gibt, werden KI-Videos in Zukunft realistischer sein.

QQ截图20240703114243.jpg

【AiBase-Zusammenfassung:】

🐼 Die Realitätsnähe des Videos ist atemberaubend und löst Diskussionen unter den Nutzern aus.

😺 Die KI-Technologie wird in der Videoproduktion weit verbreitet eingesetzt und bietet Schöpfern und Zuschauern neue Erlebnisse.

💻 Der Wettbewerb um Videogroßmodelle im In- und Ausland ist heftig. AI-generierte Film- und Fernseh-Highlights belegen Platz 26 in der Douyin-Challenge-Rangliste.

Detaillierte Informationen: https://www.aibase.com/news/9993

9. Nutzer integriert GPT-4V in seine Heimkamera – Millionen von Nutzern verfolgen seine Aktivitäten!

Ein ausländischer Nutzer hat GPT-4Vision in seine Heimkamera integriert, was Millionen von Nutzern verfolgt haben. Dieses Verhalten zeigt das Potenzial der KI-Technologie im Alltag, wirft aber auch Fragen zum Datenschutz und zur Sicherheit auf. Mit der Weiterentwicklung der Technologie erwarten wir mehr innovative und sichere Anwendungen.

image.png

【AiBase-Zusammenfassung:】

👀 GPT-4Vision in die Heimkamera integriert, Millionen von Nutzern verfolgen die Aktivitäten.

🔒 Datenschutz- und Sicherheitsbedenken werden angesprochen, um die Nutzer auf den Schutz ihrer persönlichen Daten aufmerksam zu machen.

💡 Das Potenzial der KI-Technologie im Alltag wird aufgezeigt und regt zum Nachdenken über die Anwendung der Technologie an.

Detaillierte Informationen: https://www.aibase.com/news/9995

10. Empört! Schottischer Künstler „zerstört“ seine Werke und protestiert gegen die negativen Auswirkungen von KI auf die Kunst

Der schottische Künstler Michael Forbes protestiert gegen die negativen Auswirkungen der künstlichen Intelligenz (KI) auf die Kunstwelt, indem er seine eigenen Kunstwerke beschmiert. Forbes hat bereits vier Gemälde „bearbeitet“, darunter Werke von John Lennon und der amerikanischen Sängerin Taylor Swift. Er hofft, mit seinem Handeln auf die Urheberrechtsverletzungen von KI im Kunstbereich aufmerksam zu machen. Künstler können mit computergenerierten Bildern nicht mehr konkurrieren, was dazu führt, dass viele ihren Beruf aufgeben.

image.png

【AiBase-Zusammenfassung:】

⭐ Der schottische Künstler Michael Forbes protestiert gegen die negativen Auswirkungen der künstlichen Intelligenz (KI) auf die Kunstwelt, indem er seine eigenen Kunstwerke beschmiert.

⭐ Forbes hat bereits vier Gemälde „bearbeitet“, darunter Werke von John Lennon und der amerikanischen Sängerin Taylor Swift, um auf die Urheberrechtsverletzungen von KI im Kunstbereich aufmerksam zu machen.

⭐ Künstler können mit computergenerierten Bildern nicht mehr konkurrieren, was dazu führt, dass viele ihren Beruf aufgeben.