Google hat kürzlich zwei wichtige neue Funktionen für seinen Gemini-KI-Assistenten vorgestellt: Canvas, einen kollaborativen Arbeitsbereich, und Audio Overviews, eine Audio-Zusammenfassung. Diese Erweiterungen verbessern die Funktionalität und Benutzerfreundlichkeit des KI-Assistenten erheblich.
Canvas: Echtzeit-Zusammenarbeit bei der Dokumentenerstellung
Canvas bietet Nutzern einen interaktiven Arbeitsbereich, um gemeinsam mit der KI Dokumente und Code zu erstellen. Änderungen werden in Echtzeit angezeigt, und ein integriertes Chat-Interface ermöglicht die Diskussion von Änderungen.
Besonders hervorzuheben ist die Möglichkeit, eine sofortige Vorschau von HTML- und React-Code zu generieren. Fertige Dokumente können direkt in Google Docs exportiert werden. Branchenanalysten sehen eine Ähnlichkeit zu der gleichnamigen Funktion von ChatGPT, die im Herbst letzten Jahres eingeführt wurde.
Audio Overviews: Text in dialogische Audioinhalte umwandeln
Mit Audio Overviews können Nutzer schriftliche Inhalte wie Dokumente, Präsentationen und Forschungsberichte in dialogische Audio-Podcasts umwandeln, die von zwei KI-Moderatoren analysiert und diskutiert werden.
Google demonstriert diese Technologie, indem die Ausgaben seiner aktualisierten kostenlosen Deep-Research-Funktion in KI-Audio-Podcasts umgewandelt werden. Diese Audio-Zusammenfassungen erschienen zunächst auf der NotebookLM-Plattform. Es ist zu beachten, dass diese Audioinhalte, wie andere KI-generierte Inhalte auch, ungenaue Informationen enthalten können. Nutzer sollten daher mit kritischem Blick darauf reagieren.
Derzeit unterstützt Audio Overviews nur Englisch und ist über Web und mobile Plattformen zugänglich. Nutzer können die erstellten Audiodateien herunterladen und teilen.
Das Gemini-Ökosystem wird kontinuierlich erweitert
Seit Anfang des Jahres erweitert Google aktiv sein Gemini-Ökosystem. Zu den jüngsten Aktualisierungen gehören:
- Gemini Live wurde um Video- und Bildschirmfreigabe erweitert und wird zunächst auf Samsung Galaxy S24/S25 und Pixel 9 Geräten eingeführt.
- Google plant, Gemini als Standard-KI-Assistenten für Android anstelle von Google Assistant einzusetzen.
- Drei neue Modellvarianten wurden vorgestellt: Gemini 2.0 Flash (Basismodell), Flash Lite (kostengünstige Version) und 2.0 Pro (mit erweiterter Kontextverarbeitung).
- Außerhalb der EU, der Schweiz und Großbritanniens kann Gemini jetzt auf den Google-Suchverlauf der Nutzer zugreifen und kontextuellere Antworten liefern.
- Die Plattform hat native Multimodal-Funktionen zum Generieren und Bearbeiten von Bildern sowie zum Verstehen von YouTube-Videos erhalten.
Laut Google sind die Funktionen Canvas und Audio Overviews jetzt weltweit für Gemini- und Gemini Advanced-Nutzer verfügbar.