ロンドン高等裁判所はStable DiffusionのAIモデル訓練が著作権侵害に当たらないと判決。Getty Imagesは著作権画像の大量使用を訴えたが主要主張を放棄。AI開発と著作権保護のバランスに関する重要な判断。....
英国高等法院はGetty ImagesによるStability AIへの著作権訴訟を却下。生成AIの重要な判例に。争点は著作権画像をAI学習に使用する行為の適法性。Gettyは数百万枚の無断使用を主張し、訴訟は継続中。....
人工知能企業のPerplexityは、Getty Imagesと長期間の画像ライセンス契約を締結し、自社のAI検索ツールでGettyの画像を使用することになりました。これは、過去にコンテンツの収集や著作権侵害に関する論議(例えば、Gettyの画像を盗用したと批判された経験)があったPerplexityが、正式な法的なコンテンツ協力関係を構築する重要な戦略的転換を示すものです。
豆包が全自動AIマルチボイスオーディオドラマシステムを発表。小説テキストから直接、98%の精度でキャラクターを認識し、プロ級の音声コンテンツを生成。AI音声制作に革新をもたらす。....
Gemini 3 Pro ImageベースのAI画像生成器で、テキストレンダリングと4K画質に対応しています。
AIツールで、静的な画像を瞬時にアニメーションビデオに変換し、無料でオンラインで使用でき、複数の形式で出力できます。
無料のAI画像生成器で、ナノバナナ技術に基づいています。高品質なナノバナナ画像を瞬時に生成できる点が特徴です。
オンラインAI画像編集と生成ツールで、高度なAI技術を使って瞬時にアイデアをアートに変えます。
Tesslate
WEBGEN DEVSTRAL IMAGESは、ウェブページ生成に特化した人工知能モデルで、HTML、CSS、JS、Tailwind技術を利用してシングルページ型のウェブページを生成することができます。このプロジェクトはカスタムテンプレートに基づいて訓練され、監督微調整手法を採用し、GPT - OSS - 120Bで生成されたデータセットを使用して訓練されています。
calcuis
Qwen Image Edit Plus GGUFはQwenモデルに基づく画像編集プロジェクトで、複数の実行方法を提供し、画像編集と生成タスクをサポートしています。このプロジェクトはGGUF形式を通じてモデルのデプロイと実行効率を最適化しています。
gtmepm
simpletuner-loraは、stabilityai/stable-diffusion-3.5-mediumをベースにしたLyCORISアダプターで、文書から画像生成などの画像生成タスクに特化しています。このモデルはLoRA微調整技術を使用して実装され、主に検証プロンプトとして「A photo-realistic image of a cat」を使用してトレーニングされています。
Immac
NetaYume Lumina Image 2.0はテキストから画像への拡散モデルで、GGUF形式で量子化処理されており、テキスト記述を画像に変換することができます。このモデルは最適化されており、生成品質を維持しながらメモリ使用量を削減し、パフォーマンスを向上させています。
birder-project
RoPEを採用したViT画像分類モデルで、CAPI事前トレーニングとImageNet-21Kファインチューニングを経ており、画像分類や検出タスクに適しています。
gordon-0115
実験的な自然言語から3Dモデル生成のプロセスで、改良された事前学習済みマルチビュー拡散モデルに基づく
naver-ai
ImageNet-1kデータセットでトレーニングされた軽量なRDNet画像分類モデルで、パラメータ数24M、top-1精度82.8%。
eduardo-bolognini
これはHugging Face Hubでホストされているtransformersモデルで、具体的な機能や用途はまだ明確に説明されていません。
saurabhati
VMambaは双方向状態空間モデルに基づく視覚モデルで、画像分類タスク用に設計され、ImageNetデータセットで微調整されました。
これはHugging Face Hubでホストされているtransformersモデルで、具体的な機能や用途はさらに情報を追加する必要があります
xwen99
これはImageNet-1kデータセットで学習されたKL16変分オートエンコーダ(VAE)モデルで、画像から画像への変換タスクに使用されます。
dima806
Vision Transformerアーキテクチャに基づく画像分類モデルで、ImageNet-21kデータセットで事前学習されており、多クラス画像分類タスクに適しています
microsoft
TRELLIS Image Largeは大型3D生成モデルTRELLISの画像条件版で、入力画像に基づいて3Dコンテンツを生成できます。
imagepipeline
FLUX.1-devはテキストから画像を生成する技術に基づいた超リアルスタイルの画像生成モデルで、LoRA微調整をサポートし、画像処理パイプラインに適しています。
FLUX.1-devはdiffusersライブラリを基にした画像生成モデルで、テキストから画像生成タスクに特化し、シュールなスタイルとアニメスタイルの画像生成をサポートしています。
premanthcharan
視覚トランスフォーマー(ViT)と自然言語処理を組み合わせた画像キャプション生成モデルで、入力画像に対して自然言語の説明を自動生成可能
trollek
これはh2oai/h2o-danube3-500m-baseをベースにファインチューニングされた画像プロンプト生成モデルで、短い自然言語の記述を詳細で質の高い画像生成プロンプトに変換するために特化しています。詳細な記述、Danbooruタグスタイル、混合スタイルなど、複数のスタイルの出力をサポートしています。
adamdad
KATは、従来のTransformerのチャネルミキサーをグループ化有理コルモゴロフ-アーノルドネットワーク(GR-KAN)で置き換えた新しい視覚モデルで、ImageNet-1kデータセットでトレーニングされています。
yayayaaa
Florence-2-large-ftモデルをimageinwordsデータセットでファインチューニングし、より詳細な画像説明の生成に特化
Alpiyildo
ViTアーキテクチャに基づく顔面表情認識モデルで、imagefolderデータセットで微調整され、精度は91.77%に達しました
FAL AIをベースにしたロゴ生成サーバーで、画像生成、背景除去、自動スケーリング機能を提供します。
即夢AIをベースにした画像生成サービスで、Cursor IDE用に設計され、テキスト記述から画像の生成と保存を実現します。
Model Context Protocol(MCP)に基づく軽量級のサーバーで、画像処理とクラウドアップロードに特化しています。サイズ変更、変換、最適化、および複数のクラウドストレージサービスへのアップロードをサポートし、AIアシスタントや自動化ワークフローに適しています。
Together AIとReplicateに基づく画像生成MCPサービス
このプロジェクトはStable Diffusion画像生成機能を統合したMCPサーバーで、AIエージェントに画像生成サービスを提供し、MCPプロトコルまたは直接API呼び出しを通じて画像を生成することをサポートし、開発デバッグツールも含まれています。
xAI Grok APIに基づくMCPサーバーで、AI画像分析機能を提供し、URLとローカルファイルの画像記述、メタデータ抽出、OCR文字認識をサポートします。
MCPプロトコルに基づく画像生成サーバーで、Replicateのflux-schnellモデルを使用し、テキストプロンプトによる画像生成をサポートし、さまざまなパラメータを設定できます。
Flux Image MCPサーバーはFlux Schnellモデルに基づく画像生成サービスで、Replicateプラットフォームを通じてAPIインターフェースを提供し、テキスト記述による画像生成をサポートします。
Ideogram APIに基づく画像生成MCPサーバー
TypeScriptベースのMCPサーバーで、OpenAIのDALL - E 3モデルを使ってテキストプロンプトに基づいて画像を生成します。
画像のダウンロードと処理をサポートするMCPサーバーで、一括ダウンロード、形式変換、サイズ調整、圧縮などの機能を提供します。
画像の取得と処理機能を提供するMCPサーバーで、URL、ローカルパス、numpy配列から画像を読み込み、base64エンコードされた文字列とMIMEタイプを返します。
Image Gen MCP Serverは、Model Context Protocol(MCP)標準プロトコルを通じて、さまざまなLLMチャットボットにクロスプラットフォーム、多モデルの画像生成機能を提供する汎用AI画像生成サービスです。OpenAIとGoogleの複数の画像モデルをサポートし、テキスト対話からビジュアルコンテンツへのシームレスな変換を実現します。
Stable Diffusion WebUI APIに基づくテキストから画像を生成するMCPサーバー
Google Imagen 3.0ベースの画像生成ツールで、MCPプロトコルを通じてサービスを提供し、写真レベルの画質の生成をサポートします。
CloudflareベースのMCP画像生成サービス
Image Generation MCP ServerはClaude Desktopに画像生成機能を提供するMCPサーバーで、Replicate Fluxモデルを使用し、テキストプロンプトを通じて画像生成をサポートし、Smitheryまたはnpmを通じてインストールおよび構成できます。
OpenRouter視覚モデルに基づくMCP画像分析サーバー
GPT - 4o - miniモデルに基づく画像分析MCPサーバーで、URLまたはローカルパスの画像内容分析を処理できます
このプロジェクトは、OpenAIのgpt-image-1モデルを通じて画像生成と編集機能を提供するMCPサーバーを実装しています。テキスト説明に基づく画像生成、参照画像に基づく画像の編集または修復が可能で、結果をローカルに保存することができます。