この記事では、拡散モデルの基礎であるDDPMの数学的原理を詳しく解説します。目的関数のELBO、リパラメタリゼーション、ノイズ予測を最適化することで、モデルは現実の画像の分布を学習し、リアルな画像を生成できます。DDPMは、その後の拡散モデルの発展の基礎を築きました。
関連AIニュースの推奨

PlayDiffusionリリース:音声の局所的な修正を残さずに実現するオープンソース拡散モデル

英伟達とマサチューセッツ工科大学(MIT)が共同でFast-dLLMフレームワークを発表 AI推論速度が27.6倍向上
先ごろ、テクノロジー大手の英偉達はマサチューセッツ工科大学(MIT)および香港大学と共同で、Fast-dLLMと呼ばれる新しいフレームワークを公開しました。この革新的なフレームワークは、拡散ベースの言語モデル(Diffusion-based LLMs)の推論速度を最大で27.6倍まで高速化し、人工知能の応用にさらなる強力な技術サポートを提供します。拡散モデルの課題と機会として、拡散モデルは従来の自己回帰モデル(Autoregressive Models)の強力なライバルと見られています。

3DV-TON革新動画試着:拡散モデルによるテクスチャ3D整合性で新たな体験
拡散モデルを用いたテクスチャ3D誘導による動画試着を実現する革新技術「3DV-TON(Textured3D-Guided Consistent Video Try-on via Diffusion Models)」が正式に発表されました。AIbaseの情報によると、3DV-TONは高度な3D幾何学とテクスチャモデリングを動画拡散モデルと組み合わせることで、動画における衣服の一貫性と現実感を確保し、eコマース、ファッション、仮想現実分野に新たな可能性をもたらします。

OstrisがFlex.2-preview 8億パラメーター拡散モデルを発表、ComfyUIワークフローを革新
Ostrisチームは、ComfyUIワークフローへの統合を目的とした、8億パラメーターのテキストツーイメージ拡散モデルであるFlex.2-previewを発表しました。AIbaseによると、このモデルは、線、ポーズ、深さに関する制御された生成能力に優れており、汎用的な制御と画像修復機能をサポートしています。Flux.1SchnellからOpenFlux.1、Flex.1-alphaまでの微調整進化の道を継承しています。Flex.2-previewはHu…

Character.AIがAvatarFXモデルを発表:静止画の人物を話させる
Sand AI、MAGI-1ビデオ生成モデルをオープンソース化:無限拡張、高忠実度
2025年4月21日、Sand AIはオープンソースのビデオ生成モデルMAGI-1を発表しました。革新的な自己回帰拡散アーキテクチャと卓越した性能により、生成AI分野の注目を集めています。このモデルはApache 2.0ライセンスで提供され、コード、ウェイト、推論ツールはGitHubとHugging Faceで公開されており、世界中の開発者に強力な創作ツールを提供します。MAGI-1は拡散トランスフォーマーアーキテクチャに基づいており、ブロック因果関係注意機構と並列注意機構を導入しています。

新フレームワークd1が拡散モデル推論の進歩を牽引し、強化学習アプリケーションの新潮流を巻き起こす

ファーウェイ諾亞方舟研究所と香港大学、最強のオープンソース拡散言語モデル「Dream 7B」を発表、テキスト生成の枠組みを打破
人工知能分野に新たな輝く星が加わりました!このほど、ファーウェイ諾亞方舟研究所と香港大学自然言語処理グループ(HKU NLP Group)は、Dream7Bと呼ばれる新しい言語モデルを共同で発表しました。このモデルは、これまでで最も強力なオープンソース拡散大規模言語モデルと称賛されています。Dream7Bの登場は、既存の拡散言語モデルを性能面で凌駕するだけでなく、汎用能力、数学、コード、計画能力においても、同規模の最先端の自己回帰(AR)言語モデルに匹敵、あるいはそれを上回っています。

国産AIの台頭!17億パラメーターのオープンソース画像モデルHiDream-I1が誕生
コードの力と芸術的インスピレーションが出会う時、次世代の人工知能は創造の世界の境界を静かに変えつつあります。最近、国産オープンソース画像生成モデルHiDream-I1が衝撃的な発表をしました。17億パラメーターという技術的基盤を誇るこのAIペインターは、HiDream-aiチームが力を注いで開発したもので、急速にテクノロジー界の寵児となっています。この拡散モデル技術に基づいたオープンソース画像生成ツールは、テキストの説明を高品質な画像に変換でき、ディテール描写と画像の一貫性において注目すべき能力を示しています。初期テストの結果、Hi

EasyControl:DiTモデルにControlNet並みの強力な制御機能を提供、ジブリ風変換にも対応
人工知能による絵画の分野では、拡散モデル(Diffusion Model)がU-NetアーキテクチャベースからTransformerアーキテクチャ(DiT)ベースへと移行しつつあります。しかし、DiTエコシステムは、プラグインサポート、効率性、多条件制御などの点で課題に直面しています。最近、Xiaojiu-z氏率いるチームがEasyControlという革新的なフレームワークを発表しました。これは、DiTモデルに効率的で柔軟な条件制御能力を提供することを目的としており、まるでDiTモデルに強力なCを装備したようなものです。