Die Video-zu-Audio-(V2A)-Technologie ist eine Innovation von DeepMind, die Videopixel mit Eingaben in natürlicher Sprache kombiniert, um reichhaltige Klanglandschaften zu erzeugen, die mit den Aktionen auf dem Bildschirm synchronisiert sind. Diese Technologie lässt sich mit Videogenerierungsmodellen wie Veo kombinieren, um Videos mit dramatischer Musik, realistischen Soundeffekten oder Dialogen zu versehen, die zu den Charakteren und dem Ton des Videos passen. Sie kann auch Tonspuren für traditionelles Material wie Archivmaterial oder Stummfilme generieren und eröffnet so breitere kreative Möglichkeiten.