昆仑万維、Matrix-Zero世界モデルを発表:国内初となる3Dシーンとインタラクティブビデオ生成

AIbase基地
この記事はAIbaseデイリーからのものです
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
【AIデイリーニュース】へようこそ!ここでは、AIの世界を探求するための毎日のガイドとして、AI分野のホットな話題を毎日お届けします。開発者に焦点を当て、技術トレンドの把握、革新的なAI製品の応用を支援します。最新のAI製品はこちらをご覧ください:https://top.aibase.com/1、百度:今後数ヶ月以内に文心大模型4.5シリーズを発表、6月30日より正式にオープンソース化へ本日、百度は今後数ヶ月以内に文心大模型4.5シリーズを発表し、6月30日より正式にオープンソース化する計画を発表しました。
2025年2月14日、昆侖万維集団はMatrix-Zero世界モデルを発表し、中国における空間知能分野における重要な一歩を踏み出しました。Matrix-Zeroには、3Dシーン生成大規模モデルとインタラクティブ動画生成大規模モデルの2つのサブモデルが含まれており、AI技術によるデジタルコンテンツ制作方法の変革、映画制作、ゲーム開発、具象知能などの業界の革新的な発展を目指しています。
一枚の画像から、高品質で広視野角の3Dシーンを効率的に生成することは、長年にわたる研究課題でした。従来の手法は、多くの場合、多視点データに依存したり、シーンごとの最適化に時間を要したり、背景の品質や未観測領域の再構築に課題がありました。既存技術は、単一視点からの3Dシーン生成において、情報の不足から遮蔽領域の誤りや歪み、背景のぼやけ、未観測領域の幾何構造の推定困難といった問題を抱えています。回帰に基づくモデルは、新しい視点の合成を順伝播方式で行うことができますが、複雑なシーンでは…
「AIの母」として知られるスタンフォード大学の李飛飛教授と彼女のチームは、多モーダル大規模モデルの「空間知能」に関する研究を発表しました。この研究は、これらのモデルが空間に関する記憶と想起において初期段階の能力を備えており、局所的な世界モデルを形成する可能性を示しています。研究チームは、視覚空間知能を評価するためのツールであるVSI-Benchを開発しました。VSI-Benchには、288本の現実世界のビデオに基づいた5000以上の高品質な質疑応答ペアが含まれています。テストビデオは、居住空間、専門的な場所、工業現場など、複数の地理的な場所を網羅しています。
李飛飛が創業したWorld Labsは、Google Cloudと契約を結び、AIモデルのトレーニングにおける主要な計算プロバイダーとしてGoogle Cloudを選択したことを発表しました。この取引は数億ドル規模に上る可能性があります。World Labsは、Google Cloud Platform上のGPUサーバーを利用して、大規模なマルチモーダルAIモデルに計算サービスを提供します。同社のAIモデルは「空間知能」と呼ばれ、処理・生成能力を備えています。
最近、北京大学と鵬城実験室の研究チームは、ユーザーのテキスト記述から没入感のある完全な3Dシーンを生成することを目的とした、HoloDreamerという新しい3Dシーン生成フレームワークを発表しました。