Metaは、SeamlessM4TというAI翻訳モデルを発表しました。これは、約100種類の言語に対応する音声テキスト変換、テキストテキスト変換、テキスト音声変換をサポートしています。SeamlessM4Tの音声認識能力は人間レベルに達しており、背景音や音声変化への対応も大幅に向上しています。Metaは、SeamlessM4Tモデルを研究ライセンスの下で無料でオープンソース化しただけでなく、モデルの主要なトレーニングデータセットであるSeamlessAlignも公開しました。これは、マルチモーダル翻訳に使用される公開データセットとしてはこれまで最大規模のものです。SeamlessM4Tの発表は、言語の壁のない世界への大きな一歩と見なされています。モデルにはまだいくつかの偏見や誤差が残っていますが、MetaはSeamlessM4Tを基に更なる研究と改良を行う予定です。
100言語対応!MetaがSeamlessM4Tという新しいモデルを発表、主要データセットもオープンソース化

36氪
この記事はAIbaseデイリーからのものです
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。