KI-Tagesbericht: Ein neuer König ist geboren! Runway veröffentlicht Gen-3 Alpha; Luma AI veröffentlicht die Extend-Funktion; DeepSeek veröffentlicht ein weiteres Modell; ElevenLabs ermöglicht automatische Video-Synchronisation

Willkommen beim AI-Daily-Bereich! Hier finden Sie täglich neue Informationen über die Welt der Künstlichen Intelligenz. Wir präsentieren Ihnen täglich die wichtigsten Neuigkeiten aus dem KI-Bereich, mit Fokus auf Entwickler, um Ihnen zu helfen, Technologietrends zu verstehen und innovative KI-Produktanwendungen kennenzulernen.

Neue KI-Produkte hier entdecken: https://top.aibase.com/

1. AI-Video-König kehrt zurück! Runways neues Gen3-Modell begeistert die Nutzer erneut

Dieser Artikel beschreibt Runways neueste Generation des Videogenerierungsmodells Gen-3Alpha. Dieses Modell bietet erhebliche Verbesserungen in Bezug auf Genauigkeit, Konsistenz und Bewegungsdarstellung und stellt einen wichtigen Schritt zum Aufbau eines universellen Weltmodells dar. Gen-3Alpha verfügt über zahlreiche bemerkenswerte Funktionen und Eigenschaften und entwickelt sich zu einem neuen Star in der Kreativbranche.

【AiBase Zusammenfassung:】
⭐️ Gen-3Alpha bietet deutliche Verbesserungen in Bezug auf Genauigkeit, Konsistenz und Bewegungsdarstellung und kann ausdrucksstarke, realistische menschliche Charaktere generieren.
⭐️ Gen-3Alpha unterstützt verschiedene Generierungswerkzeuge, wie Text-zu-Video, Bild-zu-Video und Text-zu-Bild-Konvertierung.
⭐️ Es ermöglicht eine präzise zeitliche Steuerung und unterstützt verschiedene erweiterte Steuerungsmodi, darunter einen Bewegungs-Pinsel, eine erweiterte Kamerasteuerung und einen Regisseur-Modus.
⭐️ Extrem stabile Licht- und Schatteneffekte, selbst bei schnell bewegten Szenen, gewährleisten eine hohe Ausgabequalität.
Mehr Videos hier ansehen: https://mp.weixin.qq.com/s/5LbM0NfkeiYFU0r4VDqpYA
Website: https://top.aibase.com/tool/gen-3-alpha

2. Luma AI veröffentlicht die Extend-Funktion – Videolänge auf über 10 Sekunden erweiterbar

Luma AI hat kürzlich sein Dream Machine-Videomodell aktualisiert und die Extend-Funktion hinzugefügt, mit der die Videolänge auf über 10 Sekunden erweitert werden kann, wobei der Originalstil und die darin enthaltenen Personen erhalten bleiben. Obwohl die Verwendung der Extend-Funktion für die Verlängerung von Videos relativ lange dauert, bleibt die Stilkonsistenz gut erhalten.

【AiBase Zusammenfassung:】
✨ Dream Machine-Upgrade mit der Extend-Funktion: Videolänge bis über 10 Sekunden, bei gleichbleibendem Stil und Objekten.
⏱️ Die Verlängerung von Videos mit der Extend-Funktion dauert länger, die Stilkonsistenz ist jedoch gut.
🔗 Details: https://www.chinaz.com/ainews/9639.shtml

3. DeepSeek veröffentlicht das Open-Source-Modell DeepSeek-Coder-V2

DeepSeek hat kürzlich das Open-Source-Modell DeepSeek-Coder-V2 veröffentlicht, das in Bezug auf Code- und Mathematikfähigkeiten GPT-4-Turbo übertrifft und weltweit führende Leistungen bietet. Das Modell verwendet eine MoE-Architektur, unterstützt mehrere Sprachen und längere Kontextlängen. Es kann kostenlos und ohne Antrag kommerziell genutzt werden.

【AiBase Zusammenfassung:】
🚀 Weltweit führende Modellleistung, besonders gut geeignet für Codegenerierung und mathematische Berechnungen.
💡 Unterstützt 338 Programmiersprachen und eine Kontextlänge von 128K, um mehr Entwicklungsbedürfnisse zu erfüllen.
🔗 Bietet API-Dienste zum gleichen Preis wie DeepSeek-V2 und zeigt hervorragende Ergebnisse in Benchmarks.
Detaillierte Informationen: https://top.aibase.com/tool/deepseek-coder-v2

4. Adobe Acrobat erhält ein großes AI-Upgrade mit Unterstützung für die Analyse mehrerer Dokumente und die Bilderzeugung

Adobe wird in Kürze eine Reihe wichtiger AI-Upgrades veröffentlichen, um die Funktionen des AI-Assistenten und die Bilderzeugungsfähigkeiten von Acrobat zu verbessern und gleichzeitig den Datenschutz zu gewährleisten. Dieses Update wird die Arbeitseffizienz erheblich steigern und die Bearbeitung großer Dokumentenmengen und die Optimierung visueller Inhalte erleichtern.

QQ截图20240618092653.png

【AiBase Zusammenfassung:】
🚀 Verbesserter AI-Assistent mit Unterstützung für die Analyse und Abfrage mehrerer Dokumente, um die Benutzerfreundlichkeit zu verbessern.
🖼️ Neuer AI-Bilderzeuger, mit dem Benutzer neue Bilder erstellen oder vorhandene Bilder in PDFs bearbeiten können.
🔒 Datenschutzgarantie: Dokumente werden zur Analyse in die Cloud hochgeladen, aber nicht zum Trainieren von AI-Modellen verwendet und sind vor der Nutzung durch Dritte geschützt.

5. Apple veröffentlicht 20 Core ML-Modelle auf der Hugging Face-Plattform

Apple hat auf der Hugging Face-Plattform 20 neue Core ML-Modelle und 4 Datensätze veröffentlicht und damit seine bedeutenden Fortschritte bei der Förderung der KI-Entwicklung gezeigt. Dieses Update umfasst nicht nur spannende neue Modelle für Text und Bilder, sondern auch eine breite Palette von Anwendungen wie Bildklassifizierung, monokulare Tiefenabschätzung und semantische Segmentierung. Apple betont die Bedeutung von Device AI und verbessert die Anwendungsleistung durch die Ausführung optimierter Modelle auf den Geräten der Benutzer, während gleichzeitig die Datensicherheit und der Datenschutz der Benutzer gewährleistet werden.

【AiBase Zusammenfassung:】
🚀 Apple veröffentlicht 20 neue Core ML-Modelle und 4 Datensätze auf der Hugging Face-Plattform und fördert damit die KI-Entwicklung.
💡 Die neu veröffentlichten Core ML-Modelle decken ein breites Anwendungsspektrum ab, darunter Bildklassifizierung, monokulare Tiefenabschätzung und semantische Segmentierung.
🔒 Apple betont die Bedeutung von Device AI: Optimierte Modelle werden auf den Geräten der Benutzer ausgeführt, um die Anwendungsleistung zu verbessern und gleichzeitig die Datensicherheit und den Datenschutz der Benutzer zu gewährleisten.
Detaillierte Informationen: https://huggingface.co/apple

6. ElevenLabs veröffentlicht Open-Source-Tool zur Generierung von Soundeffekten für Videos – automatische Sprachausgabe durch Hochladen von Videos

ElevenLabs, ein Unternehmen, das sich auf die Generierung von Audiotechnologien konzentriert, hat kürzlich seinen Einstieg in den Bereich der Videogenerierung angekündigt und ein Open-Source-Projekt veröffentlicht, mit dem Videos automatisch vertont und passende Soundeffekte generiert werden können. Mit der neuen Funktion können Benutzer durch Texteingabe verschiedene realistische Musikeffekte erstellen, was eine große Hilfe für die Film-, Spiele- und Kurzvideobranche darstellt. Neben der Soundeffektgenerierung werden auch Funktionen wie Sprachklonung und Text-zu-Sprache angeboten.

【AiBase Zusammenfassung:】
🔊 Automatische Sprachausgabe für hochgeladene Videos und Generierung passender Soundeffekte.
🎶 Erstellung verschiedener realistischer Musikeffekte durch Texteingabe, hilfreich für die Film-, Spiele- und Kurzvideobranche.
🎤 Sprachklonung und Text-zu-Sprache-Funktion für lebendigere Inhalte.
Text-zu-Audio-Eingabe: https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi
Automatische Videovertonung: https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api

7. Tencent WeChat Video Account plant Einschränkungen für den digitalen Menschen-Handel

Tencent Video Account hat kürzlich eine Überarbeitung der „Durchführungsbestimmungen für die Veröffentlichung minderwertiger Inhalte durch Video Account-Influencer“ angekündigt, um die Inhaltsqualität zu verbessern und plant, Live-Shopping mit digitalen Menschen zu verbieten. Die Überarbeitung wurde vom 7. bis 13. Juni 2024 öffentlich zur Stellungnahme ausgelegt.

【AiBase Zusammenfassung:】
⭐ Die überarbeiteten Bestimmungen zielen darauf ab, die Inhaltskontrolle von Video Accounts zu verbessern.
⭐ Verbot von Live-Shopping mit digitalen Menschen, klare Verbote für nicht-authentische Live-Inhalte.
⭐ Die Plattform wird gegen Verstöße entsprechende Sanktionen verhängen.
Details: https://www.chinaz.com/2024/0618/1624007.shtml

8. Stability AIs SD3 wird wegen Lizenzproblemen abgelehnt, CivitAI-Community sperrt entsprechende Inhalte

Das kürzlich von Stability AI veröffentlichte wichtige Modell SD3 hat aufgrund von Lizenzproblemen zu Kontroversen geführt und ist auf Widerstand in der KI-Community gestoßen. Die CivitAI-Community sperrt Inhalte im Zusammenhang mit SD3, was zu Streitigkeiten über Lizenzvereinbarungen führt. Das Unternehmen hat eine für Verbraucher bestimmte Creator-Lizenz eingeführt, die die Bedingungen für Entwickler und die Anzahl der erzeugten Bilder einschränkt. SD3 hat Probleme, bestimmte Körperhaltungen zu generieren, und seine Zukunft ist ungewiss. Der CEO ist zurückgetreten und es wurden Entlassungen vorgenommen, das Unternehmen muss die Auswirkungen der neuen Lizenzvereinbarung erläutern. Die gesamte Kontroverse hat potenzielle Auswirkungen auf die KI-Community und die Entwicklung von Open-Source-Modellen.

【AiBase Zusammenfassung:】
💥 Lizenzprobleme bei SD3 führen zu Kontroversen und Widerstand in der KI-Community.
🔒 Das Unternehmen führt eine Creator-Lizenz ein, die die Bedingungen für Entwickler und die Anzahl der erzeugten Bilder einschränkt.
❓ SD3 hat Probleme, bestimmte Körperhaltungen zu generieren, und seine Zukunft ist ungewiss.

9. Lego-Drucker Pixelbot 3000

Dieser Artikel beschreibt den von dem YouTube-Kanal-Ersteller @Creative Mindstorms entworfenen und gebauten Lego-Drucker Pixelbot 3000, der benutzerdefinierten Code und künstliche Intelligenz verwendet, um Lego-Mosaike zu generieren. Der Benutzer muss nur den Namen des Kunstwerks eingeben, die KI generiert das Bild und Pixelbot 3000 baut das Mosaik automatisch zusammen.

【AiBase Zusammenfassung:】
🤖 Mit benutzerdefiniertem Code und künstlicher Intelligenz kann Pixelbot 3000 automatisch Lego-Mosaike generieren und den Druckprozess vereinfachen.
🎨 Pixelbot 3000 verwendet DALL-E3 von OpenAI, um vereinfachte Bilder im Comic-Stil zu generieren, was letztendlich zu einem hochkontrastigen, skalierten Bild führt.
🔧 Pixelbot 3000 segmentiert das von der KI generierte Bild und nimmt eine Stichprobe der Farbe jedes Quadratmittelpunkts, um ein besseres Mosaikmuster zu erhalten.

10. Forscher bringen KI bei, Skizzen von Menschen zu erkennen

Dieser Artikel beschreibt die neue Methode eines Forschungsteams der Universität Surrey und der Stanford University, die künstliche Intelligenz gelehrt hat, die Bedeutung und die Ergebnisse von Skizzen von Menschen zu verstehen. Durch die Kombination von Skizzen und Textbeschreibungen zeigt die künstliche Intelligenz ein menschenähnliches Verständnis und kann Objekte in komplexen Szenen genau erkennen und markieren. Diese Forschung eröffnet neue Möglichkeiten für die Mensch-Computer-Interaktion und Design-Workflows.

【AiBase Zusammenfassung:】
🧠 Künstliche Intelligenz lernt die Bedeutung von Skizzen zu verstehen und zeigt menschenähnliche Leistungen.
🌳 Künstliche Intelligenz kann Drachen, Bäume, Giraffen usw. mit 85%iger Genauigkeit erkennen und markieren und übertrifft damit andere Modelle.
🎨 Die neue Methode eignet sich nicht nur für Skizzen von Nicht-Künstlern, sondern auch für Skizzen von Objekten, die nicht explizit trainiert wurden.
Detaillierte Informationen: https://arxiv.org/abs/2312.12463

11. Studie: KI-generierte Bilder geben die feinen Unterschiede der islamischen Architektur nicht genau wieder

Künstliche Intelligenz (KI) revolutioniert die Architekturplanung, aber in kultursensitiven Bereichen wie der islamischen Architektur geben KI-generierte Bilder historische Elemente nicht korrekt wieder. Die Studie weist auf ein mangelndes historisches Wissen der KI-Generatoren hin und empfiehlt Vorsicht bei der Verwendung. Die Autoren sind der Meinung, dass KI ein wertvolles Werkzeug sein kann, aber mit menschlichem Fachwissen und kultureller Sensibilität kombiniert werden muss.

【AiBase Zusammenfassung:】
🏗️ KI revolutioniert die Architekturplanung, aber im Bereich der islamischen Architektur gibt es Herausforderungen.
🕌 KI-Generatoren haben ein mangelndes historisches Wissen und geben die Details der islamischen Architektur nicht genau wieder.
🤖 KI sollte als Werkzeug zur Steigerung der menschlichen Kreativität verwendet werden und mit Fachwissen und kultureller Sensibilität kombiniert werden.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

KI-Tagesbericht: Ein neuer König ist geboren! Runway veröffentlicht Gen-3 Alpha; Luma AI veröffentlicht die Extend-Funktion; DeepSeek veröffentlicht ein weiteres Modell; ElevenLabs ermöglicht automatische Video-Synchronisation

站长之家

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

KI-Video-Technologie in spezifischen Bereichen angekommen! Runway öffnet Zugriff auf Modell-Anpassungen, fokussiert sich auf Roboter und Bauwesen

Tageszeitung AI: Runway veröffentlicht vier kleine, offene Modelle; Kunlun Wanjing veröffentlicht ein neues großes Inferenzmodell namens MindLink; Google Gemini 2.5 Deep Think wird veröffentlicht

Luma und Runway zielen auf Roboter und autonomes Fahren ab, um die zukünftigen Einnahmequellen zu erweitern

Runway stellt neuartiges Video-Editor-Modell Aleph vor – Szenen in einem Satz ändern, Spiegelungen entfernen – Entdecken Sie unendliche Kreativität!

Runway AI bringt mit großem Aufwand das Spielwelt-System heraus - ein großes interaktives Text-Abenteuer kommt

Runway AI Filmfestival öffnet groß in New York: 6000 Werke im Rennen um den Top-Ten-Ruhm

Ein Klick und schon ist es Kunst! Runway Gen-4 References öffnet neue Möglichkeiten für das Kameranotizbuch

Poe-Bericht: Der Anteil der erzeugenen Videos des Ke-Ling-Großmodells beträgt etwa 30 % und führt vor Runway

KI-Tagesbericht: Alis neues Modell Qwen3 steht kurz bevor; GitHub veröffentlicht MCP-Server; Runway veröffentlicht Gen-4 Turbo

Runway veröffentlicht Gen-4 Turbo: Noch schnellere KI-Videoerzeugung