アリババクラウドが世界初のマルチモーダルAIモデルQwen3-Omniを発表、テキスト、画像、音声、動画の統一処理を実現
アリババクラウドは世界初のネイティブなエンドツーエンドマルチモーダルAIモデルQwen3-Omniを発表し、オープンソース化しました。このモデルはテキスト、画像、音声、動画などのマルチモーダル入力をサポートし、リアルタイムのストリーミング出力を行え、応答が迅速です。テキストの事前学習とマルチモーダル混合学習を通じて、Qwen3-Omniは強力な跨モーダル能力を持ち、さまざまな分野で優れた性能を発揮しています。