小米が開発した最初のネイティブなエンド・トゥ・エンド音声大規模モデル Xiaomi-MiMo-Audio
9月19日、小米社は自社初のネイティブなエンド・トゥ・エンド音声大規模モデル Xiaomi-MiMo-Audio をオープンソース化することを発表しました。この革新的な成果は、音声技術分野における大きな突破を示しています。5年前にGPT-3が登場し、言語の汎用人工知能(AGI)の新しい時代を開いたことから、音声分野では大規模なラベル付きデータに依存する制約があり、言語モデルと同様の少サンプル一般化能力を達到することが困難でした。今や、小米が公開した Xiaomi-MiMo-Audio モデルは、革新的な前訓練技術に基づいています。