8月23日,Meta在官网宣布开源多语音、语言翻译大模型SeamlessM4T。SeamlessM4T支持100种语音、语言翻译,实现语音到文本、语音到语音、文本到语音和文本到文本的多模式翻译。SeamlessM4T集成了Meta之前发布的NLLB、MMS等翻译模型,使用270,000小时对齐语音文本数据进行训练,是目前最大、功能最全的开源翻译模型。
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。