情報

AIニュース

AIの最先端を探索、業界トレンドを完全マスター

AIニュース日報

毎日更新！AIホットトピックス＆業界最前線

情報

AIツールを探す

精確な製品選定＆多角的市場調査

AI製品ランキング

話題のAI製品総合力＆バズ度ランキング（年間/月間/デイリー）

AIプロダクト登録

AI製品を登録して、認知度アップ＆ユーザー獲得を加速！

ツール

AIツールディレクトリ

AIツール総合ナビ！あなたにピッタリのツールが見つかる

情報

AIモデルファインダー

全種類AIモデル完備！開発から研究まで、あなたのニーズを完全サポート

LLMランキング

人気AI大規模モデル性能・注目度・年/月/日ランキング

LLMプロバイダー

信頼できるAIモデルパートナーを見つけよう！安心のサポート体制

AIモデル登録

AIモデル・サービスを登録して、ターゲットユーザーに確実にリーチ！

ツール

LLM比較選定

AI大規模モデル徹底比較！あなたにピッタリのモデルが見つかる

LLMコスト計算機

AIモデルのコストを正確に把握！スマートな予算計画で無駄を削減

LLMアリーナ

マルチモデルリアルタイム評価、モデル出力結果迅速比較

情報

MCPサーバー

人気AI-MCPサービスを集約、あなたに適したサービスを迅速発見

MCPクライアント

MCPクライアントに簡単接続、強力なAI機能を呼び出し

MCPケースチュートリアル

MCP使用テクニックを学習、入門から上級まで

MCPランキング

人気MCPサービス性能ランキング、最適選択をサポート

MCPサービス提出

あなたのMCPサービスを公開・プロモーション

ツール

MCP実験場

MCPサービスを自由にテスト、オンラインで迅速体験

MCPインスペクター

MCPサービス迅速テスト、迅速リリース

GEO順位最適化サービス

GEOサービスにより、御社の企業やブランドのAI検索における支配的な表示を実現

GEOランキング照会ツール

AIプラットフォーム上のブランド認知度を測定する

ツール

AIモデル互換性チェッカー

PC環境でDeepSeek・Llamaが動作するか無料診断

情報

AIデータセット

モデルの訓練・評価・テスト用大規模データセット・ベンチマーク

ツール

インテリジェント文書認識

ユーザーに各種文書のテキスト抽出・文書処理を提供、汎用・カスタムシーン対応の多様な文書処理をサポート

AIチュートリアル

アリババクラウドが世界初のマルチモーダルAIモデルQwen3-Omniを発表、テキスト、画像、音声、動画の統一処理を実現

AIbase基地

公開日AIニュース · 1 分で読めます · Sep 23, 2025

アリババクラウドは、世界初のネイティブなエンドツーエンドのマルチモーダルAIモデルであるQwen3-Omniを発表しました。このモデルはオープンソースとして公開されています。Qwen3-Omniはテキスト、画像、音声、ビデオなどのさまざまな入力タイプを処理できる能力を持ち、リアルタイムのストリーミング出力を実現しています。テキストや自然な音声を通じても、迅速な応答が可能です。

Qwen3-Omniモデルは、複数の分野において跨モーダルな優れた性能を示しています。初期にはテキスト中心の予トレーニングと混合多モーダルトレーニングを行い、強力な多モーダル能力を備えています。特に音声と動画のパフォーマンスに優れ、テキストと画像の効果も高い水準を維持しています。36の音声および動画のベンチマークテストにおいて、Qwen3-Omniは22項目で最新のリードを達成しており、特に自動音声認識や音声理解などの分野では、同業界のGemini2.5Proと同等の性能を発揮しています。

Qwen3-Omniは119種類のテキスト言語と19種類の音声入力言語をサポートし、さらに10種類の音声出力言語（英語、中国語、フランス語、ドイツ語など）も対応しています。この機能により、グローバルユーザーへのサービスがより一層向上します。その革新的なアーキテクチャ設計はMoE（エキスパート混合）システムに基づき、AuT予トレーニングを組み合わせることで、モデルが強力な汎用的表現能力を持つようになっています。また、マルチコードブック設計により、低遅延のリアルタイム音声および動画インタラクションを確保し、自然な会話の流れをサポートしています。

Qwen3-Omniとともに、アリババクラウドは、17種類のボイス選択をサポートするテキストから音声への変換モデルであるQwen3-TTSもリリースしました。このモデルは複数の評価ベンチマークで優れた性能を示し、多くの競合製品を上回っています。特に、音声の安定性とボイスの類似度において突出しています。

Qwen-Image-Edit-2509は、別の新規リリースされたツールであり、画像編集のためのマルチ画像サポートに焦点を当てており、編集の一貫性と効果を著しく向上させています。これは単一画像だけでなく、マルチ画像の連結編集も可能であり、より複雑な編集ニーズに対応できます。

GitHub:https://github.com/QwenLM/Qwen3-Omni
huggingface:https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe

ポイント:
🌟 Qwen3-Omniは、世界初のネイティブなエンドツーエンドのマルチモーダルAIモデルで、テキスト、画像、音声、ビデオの統一処理をサポートしています。
🌐 モデルは119種類のテキスト言語と19種類の音声入力をサポートし、グローバルユーザーの多言語ニーズに応えます。
🖼️ 新たにリリースされたQwen-Image-Edit-2509は、マルチ画像編集をサポートし、編集の一貫性と効果を顕著に向上させています。

Qwen3-Omni AIマルチモーダルモデルアリババクラウドオープンソース

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

OpenAIの評価が500億ドルに急騰！従業員が66億ドルを現金化し、私企業で記録を樹立

OpenAIは従業員株式売却で66億ドルを調達、企業価値は5000億ドルに急騰し、非上場企業として史上最高値を記録。ソフトバンクなどが参加、資金は現・元従業員に直接分配され、会社には入金されず。....

Oct 4, 2025

紅杉が投資したAIデザインツールが倒産！Perplexityに買収され、90日後に閉鎖

AIデザイン企業Visual ElectricがPerplexityに買収され、90日以内にサービス終了。チームは新部門「エージェント体験」に移籍。金額は非公開。....

Oct 4, 2025

開発者はiOS 26でAppleのローカルAIモデルをどのように使用するか

iOS26でFoundation Modelsを導入、AI大モデルをオフラインで無料利用可能に。アプリ「Lil Artist」が「AIストーリーメーカー」機能を追加、キャラクター選択でパーソナライズストーリー生成。....

Oct 4, 2025

3回のシリーズファイナンスで50億ドルに急騰！Supabaseがパーソナルプログラミング界で最も目立つ存在に

オープンソースデータベースのユニコーンSupabaseは1年で3回の資金調達を完了し、総額3億8000万ドルを調達、CラウンドからEラウンドで評価額が5倍以上に急騰し50億ドルに達した。迅速な資金調達は「ホットリロード」技術のように急速で、コア戦略は従来のデータベースサービスモデルの革新にある。....

Oct 4, 2025

グーグルGemini 3.0 Proの内側テスト情報が流出：プログラミング能力が大幅に向上、来週リリース予定

グーグルGemini 3.0 Proが近日リリースされる予定で、インサイドテストバージョンではプログラミング分野での優れた性能が示されている。このモデルはProモデルとFlashモデルの2種類があり、開発者による実際のテスト結果が注目を集めている。これはOpenAI Sora 2の後を追って、AI競争の熱気が再び高まっている。

Oct 4, 2025

GoogleがChromeにおけるGeminiをワークスペースユーザーに対して全面的にオープンに

GoogleがWorkspaceユーザー向けにChromeブラウザAIアシスタント「Gemini in Chrome」を全面公開。ウェブやモバイル版と同様、即時回答や詳細分析、対話機能を提供し、Chromeの大規模更新と共に新たなブラウジング体験を実現。....

Oct 4, 2025

OpenAI 新アプリ Sora がリリース後4日でアップル App Store のトップに輝く

OpenAIが新たに提供する動画生成アプリSoraはリリースから4日でアップル App Store の無料アプリチャートのトップを獲得し、グーグルのGeminiや自社のChatGPTを上回った。このアプリはユーザーが動画を生成・編集・共有できる機能を備えており、現在は米国とカナダのiOSユーザーのみが招待制でテストを行っている。市場の反応から、AI動画ツールへの需要が強まっていることがわかる。

Oct 4, 2025

ミッキーマウスが一斉に退場！Character.AIにディズニーの弁護士から法務書簡が届くウィルソン・エイプリー系キャラクターをすべて削除

ディズニーがCharacter.AIにミッキーマウスなどのキャラクター削除を求める法的手段を取った。24時間以内に削除され、著作権侵害を主張。....

Oct 3, 2025

無料のハックブラウザが登場！Perplexityが月額200ドルのCometを誰でも使えるように。ウェブを閲覧しながらメールを書いて、チケットを取ったり、価格を比較するAIアシスタントが登場

Perplexityが無料AIブラウザ「Comet」をリリース。サイドバーAIアシスタントが複数タスクを同時処理可能。一時サーバーダウンするほどの人気に。....

Oct 3, 2025

5万6千回のダウンロードでトップ3に突入！OpenAIのSoraは全面公開前から圧倒的な人気

OpenAIの新作Soraが北米でリリースされ、初日iOSダウンロード数5.6万回を記録。AI動画生成アプリとして注目を集め、サーバーが混雑するほど人気に。現在は米加ユーザーのみ利用可能。....

Oct 3, 2025

AIニュース

AIニュース日報

AIツールを探す

AI製品ランキング

AIプロダクト登録

AIツールディレクトリ

AIモデルファインダー

LLMランキング

LLMプロバイダー

AIモデル登録

LLM比較選定

LLMコスト計算機

LLMアリーナ

MCPサーバー

MCPクライアント

MCPケースチュートリアル

MCPランキング

MCPサービス提出

MCP実験場

MCPインスペクター

GEO順位最適化サービス

GEOランキング照会ツール

AIモデル互換性チェッカー

AIデータセット

インテリジェント文書認識

アリババクラウドが世界初のマルチモーダルAIモデルQwen3-Omniを発表、テキスト、画像、音声、動画の統一処理を実現

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

OpenAIの評価が500億ドルに急騰！従業員が66億ドルを現金化し、私企業で記録を樹立

紅杉が投資したAIデザインツールが倒産！Perplexityに買収され、90日後に閉鎖

開発者はiOS 26でAppleのローカルAIモデルをどのように使用するか

3回のシリーズファイナンスで50億ドルに急騰！Supabaseがパーソナルプログラミング界で最も目立つ存在に

グーグルGemini 3.0 Proの内側テスト情報が流出：プログラミング能力が大幅に向上、来週リリース予定

GoogleがChromeにおけるGeminiをワークスペースユーザーに対して全面的にオープンに

OpenAI 新アプリ Sora がリリース後4日でアップル App Store のトップに輝く

ミッキーマウスが一斉に退場！Character.AIにディズニーの弁護士から法務書簡が届く ウィルソン・エイプリー系キャラクターをすべて削除

無料のハックブラウザが登場！Perplexityが月額200ドルのCometを誰でも使えるように。ウェブを閲覧しながらメールを書いて、チケットを取ったり、価格を比較するAIアシスタントが登場

5万6千回のダウンロードでトップ3に突入！OpenAIのSoraは全面公開前から圧倒的な人気

ミッキーマウスが一斉に退場！Character.AIにディズニーの弁護士から法務書簡が届くウィルソン・エイプリー系キャラクターをすべて削除