Flash est le dernier modèle de synthèse vocale (Text-to-Speech, TTS) d'ElevenLabs. Il génère de la parole en 75 millisecondes, temps de génération hors latence applicative et réseau. Il constitue ainsi le modèle de choix pour les agents vocaux conversationnels à faible latence. Flash v2 ne prend en charge que l'anglais, tandis que Flash v2.5 prend en charge 32 langues, chaque paire de caractères consommant 1 crédit. Dans des tests en aveugle, Flash a constamment surpassé les modèles concurrents à très faible latence, faisant de lui le modèle le plus rapide et le plus fiable.