Appleが発表した動画生成モデルSTARFlow-Vは、主流の拡散モデルではなく「正規化フロー」技術を採用し、長尺動画の安定性向上に焦点を当てています。視覚品質と生成速度は拡散モデルに匹敵し、解像度640×480ピクセル、フレームレート16fpsで出力可能です。....
アップルが動画生成モデル「STARFlow-V」を発表。主流の拡散モデルに代わる正規化フロー技術を採用し、長尺動画生成の安定性向上と誤差蓄積の低減を目指す。データ分布を直接学習することで生成プロセスを簡素化し、Soraなど競合との差別化を図る。....
アリグループと人民大学が共同開発したMoEアーキテクチャ拡散言語モデルLLaDA-MoE。20TBデータで訓練済みで、大規模訓練の拡張性と安定性を実証。LLaDA1.0/1.5やDream-7Bを上回り、推論速度が数倍向上。近日オープンソース化予定。....
研究者らがVoostフレームワークを発表し、単一の拡散変換器を用いて仮想試着・脱着の双方向学習を実現し、追加のラベルが不要です。注目温度スケーリングと自己校正サンプリング技術を革新的に採用し、モデルの安定性を向上させ、多数のベンチマークテストで優れた結果を示し、衣類と体の整列精度および生成品質を大きく向上させました。この技術はデジタルファッション分野に新たな飛躍をもたらし、プロジェクトはオープンソースとして公開されています。
追加のトレーニングを必要としない高品質な画像修復プラグインで、すべての安定拡散モデルに適用できます。
役立つAIアプリケーションをブラウザで即座に実行
SegMoEは、数分で安定拡散モデルを動的に専門家混合体に組み合わせることができる強力なフレームワークです。訓練は不要です。
OFTは、テキストから画像への拡散モデルの微調整を効果的に安定させることができます。
Alibaba
-
入力トークン/百万
出力トークン/百万
コンテキスト長
Google
$8.75
$70
1k
Chatglm
John6666
これは安定拡散XLアーキテクチャに基づくテキストから画像生成モデルで、高度なリアリティと豊富な色彩を持つ写真レベルの画像を生成するために特別に設計されています。このモデルはOnomaAIResearch/Illustrious-xl-early-release-v0をベースに構築され、肌の質感と色彩表現の向上に焦点を当てています。
KiraDepthは安定拡散XLベースのテキストから画像を生成するモデルで、奥行き、ディテール、影のある2.25D/2.5Dスタイルの画像生成に特化しており、特にアニメスタイルの創作に適しています。
高度にリアルなポニー画像の生成に特化した安定拡散モデルで、特に顔のディテール、皮膚のテクスチャ、ライティング効果に重点を置いています。
Stable Diffusion XL(安定拡散XL)をベースにしたテキストから画像を生成するモデルで、アニメスタイルの画像生成に特化しており、特に女の子のイメージや足の素材生成に優れています。
安定拡散(Stable Diffusion)技術に基づくテキストから画像を生成するモデルで、写真レベルのリアルな画像生成をサポートし、特にポニーをテーマにした画像生成に優れています。
Illustrious XL v2.0 は安定拡散XLをベースにしたテキスト生成画像モデルで、特に高品質なアニメスタイルの画像、特に女の子キャラクターの生成に特化しています。
安定拡散XLをベースにしたアニメスタイルのテキストから画像を生成するモデルで、可愛く優れたアニメの女の子イメージの生成に特化しています。
flax
JAXとFlaxで実装された安定拡散モデルで、テキストから画像生成タスクに特化しています。
TaiMingLu
安定ビデオ拡散モデル(SVD)を基に構築された動画生成プロセスで、キーフレーム生成により時間的一貫性のある動画を作成し、特定のシーンを探索するために使用されます。
CyberIllustrious は安定拡散技術に基づくテキストから画像を生成するモデルで、高品質でフォトリアリスティックな画像を生成できます。
Animagine XL 4.0は、安定拡散XLをベースにしたテキストから画像を生成するモデルで、アニメ、リアル、セミリアルスタイルの画像生成に特化しています。
これは安定拡散XLをベースにしたテキストから画像を生成するモデルで、アニメスタイルのかわいい女の子やポニーのイメージ生成に特化しています。
安定拡散技術に基づくテキストから画像を生成するモデルで、写真レベルの写実的な画像生成をサポートし、特にポニーテーマの画像生成に優れています。
安定拡散XLをベースにしたテキストから画像を生成するモデルで、高品質で写真レベルのリアルな動物画像の生成に特化しています。
安定拡散XLをベースにしたテキストから画像を生成するモデルで、アニメスタイルに特化しており、特に手や足などのキャラクターディテールと極上の光と影の効果を得意としています。
安定拡散XLをベースにしたテキストから画像を生成するモデルで、高品質で写真レベルのリアルな画像生成に特化しており、特に人物やゲームキャラクターの生成に優れています。
安定拡散XLをベースにしたアニメスタイルのテキストから画像生成モデル、高品質なアニメキャラクター作成に特化
安定拡散XLアーキテクチャに基づくテキストから画像を生成するモデルで、特にアニメスタイルの画像、特に女の子キャラクターの生成に特化しています。
Uthar
安定拡散技術に基づくテキストから画像を生成するモデルで、様々なスタイルやシーンの画像生成をサポートします。
HyperX-Sentience
ドミネーターはカンドゥAIが開発した最先端のテキスト生成画像モデルで、安定拡散v1.5を基盤としており、テキスト記述から高品質で詳細な画像を生成できます。
これは、Stability AIの画像生成と編集機能を統合したMCPサーバープロジェクトで、APIを通じて高品質の画像生成、背景削除、拡張描画、オブジェクト置換、画像拡大などの機能を実現し、ClaudeなどのMCPクライアントとシームレスに接続することができます。