Das Amazon AGI-Team hat mit BASE TTS das bisher größte Text-to-Speech-Modell veröffentlicht, das 980 Milliarden Parameter umfasst und mit 100.000 Stunden an Aufnahmen trainiert wurde. Das Team plant, dieses Modell für Lernanwendungen einzusetzen, um die menschliche Klangqualität von Text-to-Speech-Anwendungen zu verbessern.