最高のImage AIツールモデル_厳選Image情報

AIニュース

ロンドン高裁、AI画像生成器Stable Diffusionは著作権侵害を構成しないと判断

ロンドン高等裁判所はStable DiffusionのAIモデル訓練が著作権侵害に当たらないと判決。Getty Imagesは著作権画像の大量使用を訴えたが主要主張を放棄。AI開発と著作権保護のバランスに関する重要な判断。....

9.6k おととい

ロンドン高裁、AI画像生成器Stable Diffusionは著作権侵害を構成しないと判断

ロンドン高等法院がGettyのStability AI訴訟を退けた：AIモデルのトレーニングは著作権侵害にはならない

6.7k 4 日前

PerplexityとGetty Imagesが長期間のライセンス契約を締結し、コンテンツの合規性と所有権を図る

人工知能企業のPerplexityは、Getty Imagesと長期間の画像ライセンス契約を締結し、自社のAI検索ツールでGettyの画像を使用することになりました。これは、過去にコンテンツの収集や著作権侵害に関する論議（例えば、Gettyの画像を盗用したと批判された経験）があったPerplexityが、正式な法的なコンテンツ協力関係を構築する重要な戦略的転換を示すものです。

7.2k 20 時間前

PerplexityとGetty Imagesが長期間のライセンス契約を締結し、コンテンツの合規性と所有権を図る

AIデイリーニュース：ドウバオがオートマルチボイスシステムをリリース；Adobe Firefly Image 5の大幅アップグレード；Soulの音声モデルSoulX-Podcastが発表

豆包が全自動AIマルチボイスオーディオドラマシステムを発表。小説テキストから直接、98%の精度でキャラクターを認識し、プロ級の音声コンテンツを生成。AI音声制作に革新をもたらす。....

24.9k 3 時間前

AIデイリーニュース：ドウバオがオートマルチボイスシステムをリリース；Adobe Firefly Image 5の大幅アップグレード；Soulの音声モデルSoulX-Podcastが発表

AI製品

ナノバナナプロ | 次世代の構築

Gemini 3 Pro ImageベースのAI画像生成器で、テキストレンダリングと4K画質に対応しています。

画像生成

7.3k

Animate Image AI

AIツールで、静的な画像を瞬時にアニメーションビデオに変換し、無料でオンラインで使用でき、複数の形式で出力できます。

動画生成

7.7k

Oh My Images

無料のAI画像生成器で、ナノバナナ技術に基づいています。高品質なナノバナナ画像を瞬時に生成できる点が特徴です。

画像生成

6.2k

Nano Image AI

オンラインAI画像編集と生成ツールで、高度なAI技術を使って瞬時にアイデアをアートに変えます。

画像生成

7.6k

モデル

WEBGEN Devstral 24B

Tesslate

WEBGEN DEVSTRAL IMAGESは、ウェブページ生成に特化した人工知能モデルで、HTML、CSS、JS、Tailwind技術を利用してシングルページ型のウェブページを生成することができます。このプロジェクトはカスタムテンプレートに基づいて訓練され、監督微調整手法を採用し、GPT - OSS - 120Bで生成されたデータセットを使用して訓練されています。

Qwen Image Edit Plus Gguf

calcuis

Qwen Image Edit Plus GGUFはQwenモデルに基づく画像編集プロジェクトで、複数の実行方法を提供し、画像編集と生成タスクをサポートしています。このプロジェクトはGGUF形式を通じてモデルのデプロイと実行効率を最適化しています。

Simpletuner Lora

gtmepm

simpletuner-loraは、stabilityai/stable-diffusion-3.5-mediumをベースにしたLyCORISアダプターで、文書から画像生成などの画像生成タスクに特化しています。このモデルはLoRA微調整技術を使用して実装され、主に検証プロンプトとして「A photo-realistic image of a cat」を使用してトレーニングされています。

NetaYume Lumina Image 2.0 GGUF

Immac

NetaYume Lumina Image 2.0はテキストから画像への拡散モデルで、GGUF形式で量子化処理されており、テキスト記述を画像に変換することができます。このモデルは最適化されており、生成品質を維持しながらメモリ使用量を削減し、パフォーマンスを向上させています。

Rope_vit_reg4_b14_capi Imagenet21k

birder-project

RoPEを採用したViT画像分類モデルで、CAPI事前トレーニングとImageNet-21Kファインチューニングを経ており、画像分類や検出タスクに適しています。

コンピュータビジョン Pytorch

Pytorch

birder-project

Images 3Dmodel

gordon-0115

実験的な自然言語から3Dモデル生成のプロセスで、改良された事前学習済みマルチビュー拡散モデルに基づく

マルチモーダル

Diffusers

gordon-0115

Rdnet_tiny.nv_in1k

naver-ai

ImageNet-1kデータセットでトレーニングされた軽量なRDNet画像分類モデルで、パラメータ数24M、top-1精度82.8%。

Imagecaptioning4

eduardo-bolognini

これはHugging Face Hubでホストされているtransformersモデルで、具体的な機能や用途はまだ明確に説明されていません。

自然言語処理

Transformers

eduardo-bolognini

VMamba_ImageNet_82.6

saurabhati

VMambaは双方向状態空間モデルに基づく視覚モデルで、画像分類タスク用に設計され、ImageNetデータセットで微調整されました。

Image_captioning

eduardo-bolognini

これはHugging Face Hubでホストされているtransformersモデルで、具体的な機能や用途はさらに情報を追加する必要があります

Mar Vae Kl16

xwen99

これはImageNet-1kデータセットで学習されたKL16変分オートエンコーダ(VAE)モデルで、画像から画像への変換タスクに使用されます。

コンピュータビジョン

Diffusers

xwen99

Fairface_age_image_detection

dima806

Vision Transformerアーキテクチャに基づく画像分類モデルで、ImageNet-21kデータセットで事前学習されており、多クラス画像分類タスクに適しています

TRELLIS Image Large

microsoft

TRELLIS Image Largeは大型3D生成モデルTRELLISの画像条件版で、入力画像に基づいて3Dコンテンツを生成できます。

Cute Kawaii

imagepipeline

FLUX.1-devはテキストから画像を生成する技術に基づいた超リアルスタイルの画像生成モデルで、LoRA微調整をサポートし、画像処理パイプラインに適しています。

コンピュータビジョン

Diffusers

imagepipeline

Flux Anime

imagepipeline

FLUX.1-devはdiffusersライブラリを基にした画像生成モデルで、テキストから画像生成タスクに特化し、シュールなスタイルとアニメスタイルの画像生成をサポートしています。

Image_Captioning_Model

premanthcharan

視覚トランスフォーマー(ViT)と自然言語処理を組み合わせた画像キャプション生成モデルで、入力画像に対して自然言語の説明を自動生成可能

マルチモーダル

Pytorch

premanthcharan

ImagePromptHelper Danube3 500M

trollek

これはh2oai/h2o-danube3-500m-baseをベースにファインチューニングされた画像プロンプト生成モデルで、短い自然言語の記述を詳細で質の高い画像生成プロンプトに変換するために特化しています。詳細な記述、Danbooruタグスタイル、混合スタイルなど、複数のスタイルの出力をサポートしています。

Kat_tiny_patch16_224.vitft

adamdad

KATは、従来のTransformerのチャネルミキサーをグループ化有理コルモゴロフ-アーノルドネットワーク（GR-KAN）で置き換えた新しい視覚モデルで、ImageNet-1kデータセットでトレーニングされています。

Florence 2 Large Ft Moredetailed

yayayaaa

Florence-2-large-ftモデルをimageinwordsデータセットでファインチューニングし、より詳細な画像説明の生成に特化

Vit Facial Expression Recognition

Alpiyildo

ViTアーキテクチャに基づく顔面表情認識モデルで、imagefolderデータセットで微調整され、精度は91.77%に達しました

MCP

FAL AI Image Generation

FAL AIをベースにしたロゴ生成サーバーで、画像生成、背景除去、自動スケーリング機能を提供します。

python

10.3k

4.2ポイント

Image Gen Server

即夢AIをベースにした画像生成サービスで、Cursor IDE用に設計され、テキスト記述から画像の生成と保存を実現します。

python

13.5k

4.0ポイント

Image Worker Mcp

Model Context Protocol（MCP）に基づく軽量級のサーバーで、画像処理とクラウドアップロードに特化しています。サイズ変更、変換、最適化、および複数のクラウドストレージサービスへのアップロードをサポートし、AIアシスタントや自動化ワークフローに適しています。

typescript

5.5k

2.5ポイント

Image Generator

Together AIとReplicateに基づく画像生成MCPサービス

typescript

5.1k

2.5ポイント

Image_gen_mcp

このプロジェクトはStable Diffusion画像生成機能を統合したMCPサーバーで、AIエージェントに画像生成サービスを提供し、MCPプロトコルまたは直接API呼び出しを通じて画像を生成することをサポートし、開発デバッグツールも含まれています。

python

5.9k

2.5ポイント

Image Description Mcp_server

xAI Grok APIに基づくMCPサーバーで、AI画像分析機能を提供し、URLとローカルファイルの画像記述、メタデータ抽出、OCR文字認識をサポートします。

python

2.5ポイント

Image Generation (Flux Schnell)

MCPプロトコルに基づく画像生成サーバーで、Replicateのflux-schnellモデルを使用し、テキストプロンプトによる画像生成をサポートし、さまざまなパラメータを設定できます。

typescript

8.6k

2.5ポイント

Flux Image Mcp Server

Flux Image MCPサーバーはFlux Schnellモデルに基づく画像生成サービスで、Replicateプラットフォームを通じてAPIインターフェースを提供し、テキスト記述による画像生成をサポートします。

typescript

7.4k

2.5ポイント

Ideogram Images

Ideogram APIに基づく画像生成MCPサーバー

typescript

6.7k

2.5ポイント

Image Generator Mcp Server

TypeScriptベースのMCPサーバーで、OpenAIのDALL - E 3モデルを使ってテキストプロンプトに基づいて画像を生成します。

typescript

7.3k

2.5ポイント

Image Downloader

画像のダウンロードと処理をサポートするMCPサーバーで、一括ダウンロード、形式変換、サイズ調整、圧縮などの機能を提供します。

javascript

7.8k

2.5ポイント

Image Processor

画像の取得と処理機能を提供するMCPサーバーで、URL、ローカルパス、numpy配列から画像を読み込み、base64エンコードされた文字列とMIMEタイプを返します。

python

7.6k

2.5ポイント

Gpt Image Mcp

Image Gen MCP Serverは、Model Context Protocol（MCP）標準プロトコルを通じて、さまざまなLLMチャットボットにクロスプラットフォーム、多モデルの画像生成機能を提供する汎用AI画像生成サービスです。OpenAIとGoogleの複数の画像モデルをサポートし、テキスト対話からビジュアルコンテンツへのシームレスな変換を実現します。

python

7.3k

2.5ポイント