Meta lanza SeamlessM4T

Meta ha lanzado un modelo de inteligencia artificial multimodal llamado SeamlessM4T, que admite la traducción de voz y texto en hasta 100 idiomas. Este modelo puede realizar varias funciones, incluyendo reconocimiento de voz, traducción de voz a texto, traducción de voz a voz, traducción de texto a texto y traducción de texto a voz.

SeamlessM4T es un único modelo de inteligencia artificial, en lugar de una cadena de varios modelos, lo que reduce los errores y aumenta la eficiencia de la traducción. Los investigadores de Meta crearon un corpus multimodal, SeamlessAlign, que contiene más de 470.000 horas de traducción de voz automáticamente alineadas, las cuales pueden utilizarse para entrenar futuros modelos de inteligencia artificial de traducción.