AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション MCP

Stable Diffusion 3.5 Medium

テキストから画像を生成するマルチモーダル拡散変換器モデル

一般製品画像テキストから画像生成モデル

ウェブサイトを開く

Stable Diffusion 3.5 Mediumは、Stability AIによって開発されたテキストから画像を生成するモデルです。画像品質、レイアウト、複雑なプロンプトの理解、そしてリソース効率が向上しています。このモデルは、3つの固定された事前学習済みテキストエンコーダを使用し、QK正規化によって訓練の安定性を高め、最初の12の変換層にデュアルアテンションブロックを導入しています。高解像度画像生成、一貫性、そして様々なテキストから画像へのタスクへの適応性において優れた性能を発揮します。

Stable Diffusion 3.5 Medium

ウェブサイトを開く

Stable Diffusion 3.5 Medium 最新のトラフィック状況

月間総訪問数

25296546

直帰率

43.31%

平均ページ/訪問

5.8

平均訪問時間

00:04:45

Stable Diffusion 3.5 Medium 訪問数の傾向

Stable Diffusion 3.5 Medium 訪問地理的分布

Stable Diffusion 3.5 Medium トラフィックソース

Stable Diffusion 3.5 Medium 代替品

Stable Diffusion 3.5 Medium — テキストから画像を生成するマルチモーダル拡散変換器モデル

•テキストから画像•生成モデル

Stable Diffusion 3.5 Large Turbo

Stable Diffusion 3.5 Large Turbo — 高性能なテキストから画像生成モデル

•テキストから画像•生成モデル

Liquid — 視覚理解と生成を統合したマルチモーダル生成モデルです。

•マルチモーダル•生成モデル

FlexRAG — 情報検索と生成のための柔軟で高性能なフレームワーク

プログラミング

•情報検索•生成モデル

AuraFlow — オープンソースの、流に基づくテキストから画像生成モデル

•テキストから画像•生成モデル

PROTEUS — リアルタイム表情生成ヒューマンモデル

国際セレクション

•リアルタイム•生成モデル

Lumina-T2X — あらゆるモダリティへのテキスト生成を統合したフレームワーク

•テキストから画像•テキストから動画

軌道一貫性蒸留 (TCD) — テキストから画像への合成品質の一貫性を向上させる蒸留技術

•画像合成•一貫性蒸留

直交微調整 (OFT) — OFTは、テキストから画像への拡散モデルの微調整を効果的に安定させることができます。

•テキストから画像•画像合成

FLUX.1 Kontext — FLUX.1 Kontext は画像生成と編集用の生成型フロー一致モデルです。

•生成モデル•画像編集

MNN-LLM Android App — 軽量級のマルチモーダル言語モデル対応Androidアプリ。

•ディープラーニング•人工知能

LegoGPT — テキストによるプロンプトに基づいて、組み立て可能な物理的な安定したレゴデザインを生成する。

•レゴ•デザイン

InternVL3 — InternVL3オープンソース：テキスト、画像、ビデオ処理に対応する7種類のサイズ、マルチモーダル機能は工業用画像分析まで拡張

•マルチモーダル•画像処理

UNO — 生成モデルを用いて画像生成の一貫性を向上させるツールです。

•画像生成•オープンソース

Kimi-VL — マルチモーダル推論機能を備えた、効率的なオープンソースの専門家混合型ビジョン言語モデルです。

中国セレクション

•マルチモーダル•推論

EasyControl — Diffusion Transformerに効率的で柔軟な制御フレームワークを提供します。

•Diffusion Transformer•画像生成

DreamActor-M1 — DiTベースのヒューマンイメージアニメーションフレームワークであり、精細な制御と長期的な一貫性を実現します。

•ヒューマンアニメーション•ビデオ生成

Mistral Small 3.1 — テキストとビジョンタスク処理能力を強化したオープンソースモデル。

•マルチモーダル•テキスト処理

MistralOCR.net — Mistral OCR は、PDF や画像からテキスト、画像、表、数式を非常に高い精度で抽出できる強力なドキュメント理解 OCR 製品です。

•文書処理•OCR

Gemini Robotics — Gemini 2.0ベースのロボットモデル。AIを物理世界にもたらし、視覚、言語、動作能力を備えています。

国際セレクション

•人工知能•ロボット

IMM — Inductive Moment Matchingは、高品質な画像生成に使用される新しいタイプの生成モデルです。

•生成モデル•画像生成

MIDI — 多インスタンス拡散モデルを使用して、単一画像から高忠実度の3Dシーンを生成します。

•3Dモデリング•画像処理

R1-Omni — R1-Omniは、強化学習を組み合わせた全モーダル感情認識モデルであり、マルチモーダル感情認識の解釈性の向上に焦点を当てています。

プログラミング

•マルチモーダル•感情認識

OpenAI Agents SDK — OpenAI Agents SDKは、自律型エージェントを構築するための開発キットであり、複数エージェントワークフローのオーケストレーションを簡素化します。

国際セレクション

•人工知能•エージェント

SmolVLM2 — SmolVLM2は、動画コンテンツの分析と生成に特化した軽量言語モデルです。

•動画分析•テキスト生成

Inception Labs — Inception Labsは、次世代の拡散型大規模言語モデルを発表し、極めて高速で効率的で高品質な言語生成能力を提供します。

国際セレクション

•人工知能•言語モデル

SRM — ノイズ除去生成モデルによる空間推論を通じて、複雑な分布下でのビジョンタスクを解決します。

•空間推論•ノイズ除去モデル

CogView4-6B — CogView4-6Bは、高品質な画像生成に特化した強力なテキストから画像への生成モデルです。

•テキストから画像•深層学習

EgoLife — EgoLifeは、長期的なコンテキスト理解研究を推進することを目的とした、長期、マルチモーダル、多角的な日常生活AIアシスタントプロジェクトです。

•マルチモーダル•多角的

UniTok — UniTokは、視覚生成と理解のための統一的な視覚トークナイザーです。

•人工知能•視覚生成