上海交通大学とバイトダンス、LSLMを発表:「聞きながら話す」を実現するAI音声モデル
上海交通大学のLANCE研究所とバイトダンスが共同開発した、LSLMと呼ばれる革新的な音声対話モデル「小L」を発表しました。このモデルは、リアルタイムでのインタラクション、ノイズ耐性、新しい話者の認識において優れた性能を示し、人間の自然な会話に近づいています。LSLMはエンドツーエンド設計を採用し、聴覚と発声チャネルを含み、デコーダのみのTTSを使用して音声生成を行い、ストリーミング自己教師あり学習を用いて音声入力をリアルタイムで処理します。その独特の機能には、フルデュプレックスモデリングによる会話中の割り込みと交互応答、安定した音声認識を実現する強力なノイズ耐性などが含まれています。