Metaの最新技術SPIRIT-LM:会話も文章作成も感情理解も可能な、驚異的なAI言語モデル!
Meta AIが最近発表したSPIRIT-LMは、テキストと音声の自由な混合と、人間のような感情の理解と表現が可能な、画期的なマルチモーダル基盤言語モデルです。SPIRIT-LMは、事前に学習されたテキスト言語モデルを基盤として構築され、テキストと音声ユニットでの継続的な学習によって音声モダリティに拡張されています。このモデルは、音声とテキストのシーケンスを単一のトークンセットに連結し、小規模な自動管理の音声テキスト平行コーパスを用いて、単語レベルのインターリーブ手法を採用しています。