最高の拡散モデル AIツールモデル_厳選拡散モデル情報

AIニュース

トランスフォーマー構造を超える？Inceptionが世界初の拡散モデルを基盤とした推論大規模モデルMercury 2を発表

Inception LabsがMercury2モデルをリリースし、トランスフォーマー構造ではなく拡散モデルを採用することで、テキスト生成のパラダイムを転換しました。このモデルは一文字ずつ生成するのではなく、テキストを全体的に編集するように処理し、従来の大規模モデルの性能の限界を突破することを目的としています。

16k 2 分前

トランスフォーマー構造を超える？Inceptionが世界初の拡散モデルを基盤とした推論大規模モデルMercury 2を発表

テンセントWeChat AIチームが新型の拡散言語モデルWeDLMを発表し、推論効率を向上

テンセントWeChat AIチームは新型の拡散言語モデルWeDLMを発表しました。このモデルはテキスト生成の効率を向上させるために設計されています。拡散モデルと因果的注意機構を組み合わせ、トポロジカルな再配置技術によりKVキャッシュに互換性を持たせ、従来の拡散モデルが双方向の注目によって引き起こす推論効率の問題を解決し、GPTなどの大規模モデルが並列推論において抱えていた制限を打ち破りました。

17.8k 昨日

テンセントWeChat AIチームが新型の拡散言語モデルWeDLMを発表し、推論効率を向上

毎時間6700枚の違反画像が生成される！複数国政府がXプラットフォームのAI問題に取り組む

エロン・マスクのX（旧Twitter）がAIアシスタントGrokによる偽ヌード画像大量生成で信頼危機に陥っている。モデルや政治家など著名女性を対象にした画像が1時間あたり6700枚のペースで拡散した。....

10.9k 4 日前

清華がオープンソースのTurboDiffusion AI動画生成で速度が200倍に向上、エントリーレベルのGPUでも瞬時に映画のような映像を生成！

清华大学TSAILラボと生数科技が共同でオープンソースした動画生成高速化フレームワークのTurboDiffusionは、AI動画拡散モデルの推論速度を100〜200倍に向上させ、視覚的な品質はほぼ損なわれていません。この技術は現在のオープンソースモデルに対して深い最適化を施し、一枚のRTX 5090 GPUで分単位から秒単位までリアルタイムでの生成を実現し、AIによる動画創作の新時代を切り開きました。

14k 8 時間前

清華がオープンソースのTurboDiffusion AI動画生成で速度が200倍に向上、エントリーレベルのGPUでも瞬時に映画のような映像を生成！

AI製品

Wan2.2

世界初のオープンソースMoEビデオ生成モデルで、テキスト/画像から720Pビデオへの変換をサポートします。

MoEアーキテクチャ

5.9k

Audio-SDS

ソース分離と合成を行うための革新的な手法としてのオーディオ拡散モデル。

音声生成

F Lite

F Liteは、著作権遵守と安全な内容に焦点を当てた1兆パラメーター規模の拡散モデルです。

画像生成

9.1k

ChatDLM

ブロック拡散と専門家混合技術を融合した、初の効率的な推論言語モデル

チャットボット

7.7k

モデル

Gemini 2.0 Flash-Lite

Google

$0.49

入力トークン/百万

$2.1

出力トークン/百万

コンテキスト長

GPT-4.1 mini

Openai

$2.8

入力トークン/百万

$11.2

出力トークン/百万

コンテキスト長

Grok 4 Fast

Xai

$1.4

入力トークン/百万

$3.5

出力トークン/百万

コンテキスト長

o3 - mini

Openai

$7.7

入力トークン/百万

$30.8

出力トークン/百万

200

コンテキスト長

GPT-5 Codex

Openai

入力トークン/百万

出力トークン/百万

コンテキスト長

Claude 3 Opus

Anthropic

$105

入力トークン/百万

$525

出力トークン/百万

200

コンテキスト長

Gemini 2.0 Flash

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

Claude Haiku 4.5

Anthropic

入力トークン/百万

$35

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash

Google

$2.1

入力トークン/百万

$17.5

出力トークン/百万

コンテキスト長

Claude Sonnet 4.5

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Claude 3 Sonnet

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash-Lite

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

qwen-image-plus

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-vl-plus

Alibaba

入力トークン/百万

$10

出力トークン/百万

256

コンテキスト長

wan2.5-i2i-preview

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-max

Alibaba

入力トークン/百万

$24

出力トークン/百万

256

コンテキスト長

Qianfan-Lightning

Baidu

入力トークン/百万

出力トークン/百万

128

コンテキスト長

qwen3-vl-235b-a22b-thinking

Alibaba

入力トークン/百万

$20

出力トークン/百万

コンテキスト長

qwen3-coder-plus

Alibaba

入力トークン/百万

$16

出力トークン/百万

コンテキスト長

qwen-image-edit

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

MCP

Comfyui_storydiffusion

ComfyUI_StoryDiffusionはComfyUIベースのプラグインで、StoryDiffusionとMS - Diffusionモデルをサポートし、一貫した長いシーケンスの画像とビデオを生成するために使用されます。このプロジェクトは、二人のキャラクターの同時表示、ControlNet制御、Lora加速、テキストから画像への変換、画像から画像への変換など、さまざまな機能をサポートしています。

python

9.2k

2.0ポイント

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

ビジネス協力サイトマップ

AIニュース

トランスフォーマー構造を超える？Inceptionが世界初の拡散モデルを基盤とした推論大規模モデルMercury 2を発表

テンセントWeChat AIチームが新型の拡散言語モデルWeDLMを発表し、推論効率を向上

毎時間6700枚の違反画像が生成される！複数国政府がXプラットフォームのAI問題に取り組む

清華がオープンソースのTurboDiffusion AI動画生成で速度が200倍に向上、エントリーレベルのGPUでも瞬時に映画のような映像を生成！

AI製品

Wan2.2

Audio-SDS

F Lite

ChatDLM

モデル

Gemini 2.0 Flash-Lite

GPT-4.1 mini

Grok 4 Fast

o3 - mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-vl-plus

wan2.5-i2i-preview

qwen3-max

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

qwen3-coder-plus

qwen-image-edit

FLUX.2 Dev Gguf

Wan2.2 I2V A14B Diffusers

Stable Diffusion 2 1 Base

Stable Diffusion 2

Stable Diffusion 2 1 Unclip

Qwen3 Nemotron 8B BRRM

Inversion DPO

SD15 ControlNet

RND1 Base 0910

Pandora

CoDA V0 Instruct

LLaDA MoE 7B A1B Base

SRPO

RUSK

Jib Mix Illustrious Realistic V30 Rapture Sdxl

Qwen Image Lighting Gguf

NetaYume Lumina Image 2.0 GGUF

Semantic Diffusion Echo Dehazing

Chroma 8 Steps GGUF

SpatialGen 1.0

MCP

Comfyui_storydiffusion