腾讯混元开源文生3D动作大模型HY-Motion1.0は、10億パラメータを持つDiffusion Transformerアーキテクチャを採用し、高品質な標準化されたスケルトンアニメーションを生成します。ゲーム開発者、アニメーター、研究者の効率向上を支援し、3Dアニメーション制作のハードルを下げ、個人クリエイターの創造性実現を促進します。....
Black Forest LabsがFLUX.2シリーズ4モデルを発表。32Bパラメータ版をオープンソース化。10枚の参照画像から95%以上の一貫性で画像生成可能で、姿勢・光影・配色を固定。4MP編集機能で局部再描画や背景置換ができ、400万画素解像度を実現。PSDレイヤー出力も計画中。....
ComfyUIクラウドプラットフォームがパブリックベータ開始。ローカル環境や高性能GPU不要で、ブラウザからフル機能のStable Diffusionを利用可能。AI画像生成のハードルを大幅に下げ、クリエイターが手軽にプロ級のAIビジュアル制作を実現。....
ロンドン高等裁判所はStable DiffusionのAIモデル訓練が著作権侵害に当たらないと判決。Getty Imagesは著作権画像の大量使用を訴えたが主要主張を放棄。AI開発と著作権保護のバランスに関する重要な判断。....
Diffusion Transformerアーキテクチャに基づき、10億パラメータを持つテキストから3D動作を生成するモデルです。
Stable Diffusion をベースにした無料のオンラインAI絵画ツールです。
Diffusion Transformerに効率的で柔軟な制御フレームワークを提供します。
Animagine XL 4.0は、高品質なアニメ風画像生成に特化したStable Diffusion XLモデルです。
Google
-
入力トークン/百万
出力トークン/百万
コンテキスト長
sd2-community
Stable Diffusion v2-1-baseは、テキストから画像を生成する拡散モデルで、v2-baseをベースに220kの追加ステップで微調整されています。このモデルは、テキストプロンプトに基づいて画像を生成および修正でき、複数の解像度出力をサポートし、アート創作や教育研究などのさまざまな分野に適しています。
Stable Diffusion v2は拡散モデルに基づくテキストから画像生成モデルで、テキストプロンプトに基づいて画像を生成および修正することができます。このモデルはLAION - 5Bデータセットのサブセットで訓練され、オートエンコーダと拡散モデルを組み合わせて潜在空間で訓練され、複数の解像度とタスクをサポートします。
Stable Diffusion v2-1-unclipはStable Diffusion 2.1をベースに微調整された拡散モデルで、テキストプロンプトとCLIP画像埋め込みを受け取り、画像バリエーションの作成やテキストから画像へのCLIP事前学習モデルと組み合わせて使用できます。
AbstractPhil
これは実験的なStable Diffusion 1.5蒸留モデルで、v - 予測流れマッチング方法と幾何誘導の適応的ブロック重み付け技術を採用しています。現在は研究段階にあり、訓練が進行中で、結果はまだ検証されていません。
ashllay
Stable Diffusion XLをベースに、Inversion-DPO方法でUNetの重みを微調整し、直接嗜好最適化(DPO)技術と反転方法を組み合わせて、画像生成品質とアライメント度を向上させた拡散モデル
Cassius6668
これはStable Diffusion XLベースモデル1.0に基づくLoRA適合ウェイトで、特定のスタイルに合わせて微調整され、特定のアートスタイルの画像生成に使用できます。
John6666
XL-Sat-IORはStable DiffusionとStable Diffusion XLアーキテクチャに基づくテキストから画像への生成モデルで、高度なリアリティ、豊かな色彩、映画的な質感、精細な細部、優れた光と影、生き生きとした表情を持つ画像を生成することができます。
MadhavRupala
Stable Diffusion v1-5は潜在拡散技術に基づくテキストから画像生成モデルで、テキスト記述に基づいてリアルな画像を生成できます。このモデルはLAION - 2Bデータセットで訓練され、英語テキスト入力をサポートし、512x512解像度の画像を生成します。
これはStable DiffusionとStable Diffusion XL技術に基づくテキストから画像への生成モデルで、人物の肖像、テクスチャ、肌の表現を特別に最適化し、リアルで自然な画像を生成できます。
これはStable Diffusion XLに基づくテキストから画像への生成モデルで、アジアスタイルの画像生成に特化して最適化されており、リアル感と美感を持つ画像作品を生成することができます。
Illustrious-xl-early-release-v0は、Stable Diffusion XLアーキテクチャに基づくテキストから画像生成モデルで、アニメや2Dイラストスタイルに特化して最適化されており、テキスト記述に基づいて高品質な画像作品を生成することができます。
worstcoder
これはDiffusionNFT手法を用いてSD3.5 - Mediumを微調整したLoRAモデルで、革新的なオンライン強化学習パラダイムを採用し、テキストから画像生成タスクで優れた性能を発揮し、生成品質と訓練効率を大幅に向上させています。
nunchaku-tech
Stable Diffusion XL Base 1.0をベースにした量子化バージョンで、SVDQuant技術を用いて4ビット量子化を実現し、高品質な画像生成能力を維持しながら推論効率を大幅に向上させます。
Illustrious-xl-early-release-v0は、Stable Diffusion XL技術に基づくテキストから画像への生成モデルで、アニメ、半リアル、華麗なスタイルの画像生成に特化しています。このモデルはreijlitaによって開発され、高品質の画像生成をサポートし、さまざまなクリエイティブシーンに適しています。
Stable Diffusion XL技術に基づくテキストから画像へのモデルで、専門的にアニメスタイルのガール画像を生成し、クリエイティブデザイン分野をサポートします。
Noobai-XL-1.0はStable Diffusion XL技術に基づくテキストから画像への生成モデルで、リアルな写实スタイルの画像生成に特化し、画像創作分野に高品質のAI生成ソリューションを提供します。
Stable Diffusion XLに基づくテキストから画像への生成モデルで、高品質で細部が豊富な画像の生成に特化しており、特にアニメ、半リアル、リアルなスタイルに長けており、手部の細部と画面の輝度において顕著な改善が見られます。
Realistic Vision V5.1は、Stable Diffusion XLに基づくテキストから画像への生成モデルで、高品質でリアルな人物肖像やシーン画像の生成に特化しています。このモデルは、リアル、アニメ、ゲームなどの多様なスタイルをサポートし、高度なリアリティを持つ人物、女優の肖像やアニメスタイルの画像を生成することができます。
暗影沉默はStable Diffusion XL技術に基づくテキストから画像への生成モデルで、神秘的な魅力を持つアニメスタイルの女性キャラクター画像の生成に特化しており、明暗対比の処理に優れた性能を発揮します。
Realism Illustriousは、Stable Diffusion XLをベースにしたテキストから画像を生成するモデルで、アニメとリアリズムスタイルの画像生成に特化して最適化されています。このモデルは人物の細部、色彩グラデーション、ダイナミックレンジにおいて優れた性能を発揮し、高品質のビジュアルコンテンツを生成することができます。
Stable Diffusion WebUI APIに基づくテキストから画像を生成するMCPサーバー
DiffuGenは高度なローカル画像生成ツールで、MCPプロトコルを統合し、複数のAIモデル(FluxやStable Diffusionシリーズを含む)をサポートし、開発環境で直接高品質な画像を生成できます。柔軟な設定オプション、複数GPUのサポートを提供し、MCPプロトコルを通じて複数のIDEと統合でき、同時に外部呼び出し用のOpenAPIインターフェースも提供します。
このプロジェクトはStable Diffusion画像生成機能を統合したMCPサーバーで、AIエージェントに画像生成サービスを提供し、MCPプロトコルまたは直接API呼び出しを通じて画像を生成することをサポートし、開発デバッグツールも含まれています。
MCPサーバーに基づくPowerPointプレゼンテーション生成プロジェクトで、APIを介してStable Diffusionを呼び出して画像を生成することをサポートし、さまざまなスライドテンプレートと編集機能を提供します。
StableMCPはJSON - RPC 2.0に基づくモデルコンテキストプロトコル(MCP)サーバーで、Stable Diffusionを通じて画像を生成するために使用されます。
このプロジェクトはStable Diffusion画像生成機能を統合したMCPサーバーで、AIエージェントに画像生成サービスを提供し、開発デバッグツールとGooseプラットフォームへの統合機能を備えています。
ComfyUI_StoryDiffusionはComfyUIベースのプラグインで、StoryDiffusionとMS - Diffusionモデルをサポートし、一貫した長いシーケンスの画像とビデオを生成するために使用されます。このプロジェクトは、二人のキャラクターの同時表示、ControlNet制御、Lora加速、テキストから画像への変換、画像から画像への変換など、さまざまな機能をサポートしています。