Sand AI、MAGI-1ビデオ生成モデルをオープンソース化：無限拡張、高忠実度

AIbase基地

公開日AIニュース · 1 分で読めます · Apr 22, 2025

2025年4月21日、Sand AIはオープンソースの動画生成モデルMAGI-1を発表しました。革新的な自己回帰拡散アーキテクチャと卓越した性能により、生成AI分野の中心に躍り出ました。

このモデルはApache 2.0ライセンスを採用しており、コード、ウェイト、推論ツールはGitHubとHugging Faceで公開されています。世界中の開発者に強力な創作ツールを提供します。

MAGI-1は拡散トランスフォーマーアーキテクチャに基づいており、ブロック因果関係注意機構、並列注意機構ブロック、Sandwich正規化などの技術革新を取り入れています。ブロック単位（ブロックあたり24フレーム）での生成により、効率的な動画生成を実現しています。独自のパイプライン設計により並列処理が可能で、最大4つのブロックを同時に生成でき、効率の大幅な向上を実現しています。

このモデルは高速蒸留技術を用いており、柔軟な推論予算に対応できます。物理的挙動予測と時間的一貫性において優れた性能を発揮し、長編物語や複雑な動的シーンに適しています。「無限動画拡張」機能により、動画コンテンツをシームレスに延長でき、「秒単位の時間軸制御」と組み合わせることで、ブロック単位のプロンプトによるシーン切り替えや精密な編集が可能になり、映画制作やストーリーテリングなどのニーズに対応できます。

画像から動画への変換タスクにおいて、高精細な出力を実現し、ネイティブ解像度は1440x2568pxに達します。動作は滑らかで、細部までリアルです。オープンソースモデルとして、MAGI-1はDockerによる展開をサポートしています。24Bパラメータのバージョンには8枚のH100 GPUが必要ですが、将来の4.5Bパラメータのバージョンは単一のRTX 4090に対応し、使用ハードルの低下が期待されます。

コミュニティからのフィードバックでは、生成品質と指示遵守能力が高く評価されており、Kling 1.6とWan 2.1を上回るスコアを獲得しています。しかし、非現実的なスタイルのコンテンツについては、改善の余地があります。

競争の激しい動画生成分野において、MAGI-1はオープンソースと自己回帰アーキテクチャによって際立っています。Sand AIはより軽量なバージョンのリリースとハードウェア最適化の深化を計画しており、将来はリアルタイム生成や仮想現実などのアプリケーションを推進する可能性があります。MAGI-1の発表は技術的なブレークスルーであるだけでなく、オープンソースエコシステムへの貢献であり、動画制作の在り方を塗り替える可能性を秘めています。

詳細はsand.aiまたはHugging Face（huggingface.co/sand-ai/MAGI-1）をご覧ください。

MAGI-1 SandAI 自己回帰拡散モデル生成AI

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

AI時代における広告業界の適応：GoogleからChatGPTへの変遷

インターネット発展の歴史において、Googleの台頭はほぼ伝説的です。1999年の設立以来、Googleはシンプルで広告のない検索体験で多くのユーザーを獲得し、創設者のラリー・ペイジとセルゲイ・ブリンは初期において広告を強く避け、広告が検索の質に影響を与える可能性があると信じていました。しかし、2000年になると、Googleは収益化のためAdWordsを発表し、広告収入に依存する巨大企業へと急速に変貌を遂げ、広告は検索結果ページの重要な構成要素となりました。しかし

Apr 28, 2025

GPT-4oの画像生成能力がGPTsに統合、パーソナライズされた画像生成AIの新時代へ

OpenAIは、GPT-4oの画像生成能力をGPTs（カスタムGPT）プラットフォームに正式統合したと発表しました。これにより、開発者やクリエイターは、パーソナライズされた画像生成AIロボットを構築するための強力なツールを獲得しました。AIbaseの情報によると、このアップデートにより、ユーザーはGPTsを使用して、ポスターデザインロボットや特定の芸術スタイルのジェネレーターなどの独自の画像生成アプリケーションを作成できるようになり、創造性の柔軟性と共有性が大幅に向上します。ソーシャルメディア上での活発な議論は、その広範な影響力を示しており、関連機能はChatGPT Plus、P…（以下略）

Apr 27, 2025

開発者必見！AI推奨パッケージの5分の1は偽物、Slopsquatting攻撃の脅威

サイバーセキュリティ研究者らが警告を発しています。新たなソフトウェアサプライチェーン攻撃である「Slopsquatting」が水面上に現れました。この攻撃は、生成AI（LLMなど）がコード作成時に起こりうる「パッケージ幻覚」――存在しないパッケージ名を推奨する現象――の脆弱性を突きます。攻撃者はこれらの架空の名称を先取り登録し、悪意のあるコードを埋め込むことができます。画像注記：画像はAIによって生成され、画像ライセンス提供業者Midjourneyから提供されています。研究チームは、AIがでっち上げたパッケージ名はしばしば非常に類似性が高いことを発見しました。

Apr 27, 2025

Google AI、現実世界の生成AIアプリケーション601事例を発表各業界を網羅

Apr 27, 2025

PixverseがMCPを発表：ワンクリックでAIビデオ生成の新たな境地へ

生成AI技術の急速な発展に伴い、ビデオ制作分野は新たな変革期を迎えています。AIビデオ生成分野をリードするプラットフォームであるPixverseは、最近、Model Context Protocol（MCP）を発表し、ユーザーと開発者により効率的で柔軟なビデオ生成ソリューションを提供します。MCPとは何か？AIビデオ生成の新たな方法を解き放つPixverseのMCP（Model Context Protocol）は、AIビデオ生成のために特別に設計された…

Apr 25, 2025

AIを活用した業務効率化で、英国の従業員は年間122時間節約可能に！

最近のGoogleの報告書によると、従業員へのAI（人工知能）の有効なトレーニングにより、英国経済はAI推進の成長から4000億ポンド（約5330億米ドル）の利益を得られる可能性があるとのことです。この報告書は英国で行われたパイロットプログラムに基づいており、その結果、従業員はAIツールを使用することで、事務作業において平均年間122時間以上の時間を節約できることが示されました。報告書では、AIの使用手順の簡素化と適切なトレーニングの提供が、AI普及率向上のための鍵であると強調しています。Googleの欧州、中…

Apr 25, 2025

動画制作の常識を覆す！アリババのVACEモデル、テキスト・画像・動画入力を統合処理

アリババグループの科学者チームが、幅広い動画生成と編集タスクを統一的に処理することを目的とした汎用AIモデル、VACEを発表しました。VACEの中核は、強化された拡散Transformerアーキテクチャであり、その革新的な点は「ビデオ条件ユニット（VCU）」という新しい入力形式です。VCUは、テキストプロンプト、参照画像や動画シーケンス、空間マスクなど、多様なモダリティの入力を統一的な表現に凝縮し、専用のメカニズムによって異なる入力間の調整を行い、競合を回避します。概念の分離により、きめ細やかな制御を実現します。

Apr 23, 2025

世界初の自己回帰型ビデオ生成大規模言語モデルMAGI-1が発表 Swin Transformerチームがビデオ制作の新潮流をリード

ビデオ生成分野において、最近強力な新モデルが登場しました。それはMAGI-1です。マル賞と清華特等奨学金受賞者である曹越氏が率いるスタートアップ企業Sand AIが発表したこの自己回帰型ビデオ生成大規模言語モデルは、ビデオ制作の可能性を再定義しつつあります。MAGI-1はビデオブロックのシーケンスを予測することでビデオを生成し、その自然で滑らかな効果と複数のダウンロード可能なバージョンにより、広く注目を集めています。MAGI-1はビデオ生成において多くの優れた性能を備えています。まず、シームレスで滑らかなビデオ体験を提供し、生成されたビデオは…

Apr 22, 2025

JEDECがHBM4規格を発表、AIと高性能コンピューティングの新時代を支援

JEDECソリッドステートテクノロジー協会は、待望の高帯域幅メモリ（HBM）規格であるHBM4を発表しました。HBM3規格の進化版であるHBM4は、データ処理速度のさらなる向上を目指すとともに、より高い帯域幅、エネルギー効率、そして単一チップまたはスタックの容量の大幅な増加を実現し、大規模データセットと複雑な計算の高効率処理ニーズに対応します。HBM4規格は、生成AI、高性能コンピューティング、ハイエンドGPU、サーバーなどのアプリケーションに適した、いくつかの重要な技術的改良をもたらします。まず、HBM4の帯域幅は大幅に増加し...

Apr 22, 2025

Vidu Q1正式リリース高画質、滑らかな動画を実現

生数科技は、高性能な生成AIビデオモデルであるVidu Q1を正式にリリースしました。最高の画質、滑らかな映画のようなトランジション、正確なサウンドエフェクト、強化されたアニメーションスタイルにより、業界で話題となっています。AIbaseの情報によると、Vidu Q1はVBench総合ビデオ生成評価基準において既存の競合製品を凌駕し、4つの主要機能の全面的なアップグレードにより、クリエイターにプロの映画スタジオに匹敵する制作体験を提供します。プロジェクトの詳細については、Viduの公式ウェブサイトとソーシャルメディアで公開されており、AIビデオ生成技術の進化を象徴しています。

Apr 22, 2025

100

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

Sand AI、MAGI-1ビデオ生成モデルをオープンソース化：無限拡張、高忠実度

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

AI時代における広告業界の適応：GoogleからChatGPTへの変遷

GPT-4oの画像生成能力がGPTsに統合、パーソナライズされた画像生成AIの新時代へ

開発者必見！AI推奨パッケージの5分の1は偽物、Slopsquatting攻撃の脅威

Google AI、現実世界の生成AIアプリケーション601事例を発表 各業界を網羅

PixverseがMCPを発表：ワンクリックでAIビデオ生成の新たな境地へ

AIを活用した業務効率化で、英国の従業員は年間122時間節約可能に！

動画制作の常識を覆す！アリババのVACEモデル、テキスト・画像・動画入力を統合処理

世界初の自己回帰型ビデオ生成大規模言語モデルMAGI-1が発表 Swin Transformerチームがビデオ制作の新潮流をリード

JEDECがHBM4規格を発表、AIと高性能コンピューティングの新時代を支援

Vidu Q1正式リリース 高画質、滑らかな動画を実現

Google AI、現実世界の生成AIアプリケーション601事例を発表各業界を網羅

Vidu Q1正式リリース高画質、滑らかな動画を実現