最高のMMDit AIツールモデル_厳選MMDit情報

AIニュース

通義千問が大規模オープンソースのQwen-Imageを発表：20BパラメータのMMDiTモデルが画像生成のSOTAを全面的に更新

説明はありません

アリババ・テンスフォースが新規のテキストから画像生成モデルQwen-Imageをオープンソース化

テンスフォースシリーズ初のオープンソースモデルとして、20億パラメータを持つマルチモーダルディフュージョントランスフォーマー（MMDiT）ベース画像生成モデルであるQwen-Imageをリリースしました。この革新的な成果は、複雑なテキストレンダリングや正確な画像編集において画期的な進展を遂げ、複数の公開ベンチマークテストにおいて優れた性能を示し、画像生成と編集分野で注目を集めています。Qwen-Imageは強力なテキストレンダリング能力を備えており、複数行のレイアウト、段落レベルのテキスト生成、細かい細部の表現をサポートしています。英語だけでなく中国語においても対応可能です。

10.4k 23 時間前

アリババ・テンスフォースが新規のテキストから画像生成モデルQwen-Imageをオープンソース化

階躍星辰、画像生成モデルStep-1X-Mediumを発表　画像から画像生成などの新機能に対応

上海階躍星辰智能科技有限公司は先日、画像生成モデルStep-1Xシリーズの大幅なアップグレードを発表し、性能が向上したStep-1X-Mediumバージョンをリリースしました。このアップグレード版では、MMDitアーキテクチャに基づき生成速度が30％以上向上しました。また、ターゲットを絞ったトレーニングにより、理解力とテキストと画像の一貫性が向上し、生成された画像のディテールと質感がより自然になりました。

9.6k 23 時間前

階躍星辰、画像生成モデルStep-1X-Mediumを発表　画像から画像生成などの新機能に対応

無料商用利用可！Stability AIが軽量AIペイントツール「Stable Diffusion 3.5 Medium」モデルを発表

Stability AIが技術的障壁を再び突破し、新しいStable Diffusion 3.5 Mediumモデルを発表しました。この一般ユーザー向けのAIペイントツールは、完全に無料で商用利用が可能であるだけでなく、高性能と普及性の完璧なバランスを実現しています。多様なモダリティ拡散変換器（MMDiT-X）アーキテクチャを採用したこのモデルは、25億パラメータの簡素な設計により、一般ユーザーのハードウェアのハードル問題を巧みに解決しました。わずか9.9GBのVRAMで、ほとんどの消費者向けグラフィックカードでスムーズに動作します。

10.9k 2 時間前