MetaのAI動画製品「Vibes」が欧州で正式リリース。Meta AIアプリに統合され、テキストプロンプトからAI生成動画を作成可能。他ユーザー作品のリミックスや音楽追加、スタイル調整後、SNSへ共有できる協創型AIコンテンツエコシステムを推進。....
X(旧Twitter)はAIを活用したコンテンツ検証を拡大し、情報の信頼性向上を図っています。コミュニティノートの約10%を8つのAIボットが自動生成。例として、10月の抗議動画にMSNBC関連の注釄を自動追加しました。....
Metaが欧州でAI生成動画プラットフォーム「Vibes」を開始。TikTok類似機能で全コンテンツをAI生成。米国展開6週間後の欧州進出は、OpenAIのSora公開と時期重なり、AI動画競争激化を示す。....
Google Gemini AIが「深度研究」機能をリリース。Gmail、ドライブ、チャット記録から情報を抽出し、カスタマイズ可能な研究レポートを自動生成。多段階の研究計画とウェブ検索により、包括的で正確な研究をサポート。....
音声駆動の唇形同期生成器で、画像を無限の長さの生き生きとした動画に変換でき、無料で試用できます。
高品質な動画を1クリックで生成し、クリエイティブを簡単に実現。
LTX-2 はマルチモーダル AI 動画生成モデルです。
AI駆動、迅速かつ安全にAI生成動画のウォーターマークを除去、元の質を損なわず高品質
google
$0.72
入力トークン/百万
$2.88
出力トークン/百万
1M
コンテキスト長
unsloth
Qwen3-VL-32B-ThinkingはQwenシリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長文脈処理、空間および動画の動的理解能力、そして優れたエージェント対話能力を備えています。
Qwen
Qwen3-VL-2B-Instruct-GGUFは通義千問シリーズのマルチモーダルビジュアル言語モデルのGGUF量子化バージョンで、20億のパラメータを持ち、画像理解とテキスト生成のシームレスな融合をサポートし、CPUやGPUなどのデバイスで効率的に動作します。
Qwen3-VLはこれまでのQwenシリーズで最も強力なビジュアル言語モデルで、テキスト理解と生成、ビジュアル認識と推論、コンテキスト長、空間と動画の動的理解、エージェントの対話能力などの面で全面的にアップグレードされています。このモデルはハイブリッドエキスパート(MoE)アーキテクチャを採用し、卓越したマルチモーダル処理能力を提供します。
Qwen3-VLはQwenシリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認識と推論能力、長文脈のサポート、強力な空間と動画の動的理解能力、そして優れたエージェント対話能力を備えています。
bartowski
これはQwen3-VL-2B-Instructモデルの量子化バージョンで、llama.cppツールとimatrix方法を使用して、さまざまな量子化レベルのモデルファイルを生成し、さまざまなハードウェア環境で高効率に動作させることができます。このモデルは20億パラメータのマルチモーダルビジュアル言語モデルで、画像とテキストの相互作用をサポートしています。
Qwen3-VLはQwenシリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長いコンテキストサポート、強力な空間と動画の動的理解能力、そして優れたエージェント対話能力を備えています。
jayn7
このプロジェクトは、LightX2Vチームによって開発された万2.2蒸留モデルの量子化GGUFバージョンを提供しています。これは、画像から動画への変換や動画生成タスクに特化しています。このバージョンは最適化されており、ComfyUI - GGUFなどのツールと連携して、効率的な推論性能を提供します。
lightx2v
LoRAに基づく4ステップ推論の高性能動画生成モデルで、Wan2.2蒸留モデルから抽出されたLoRA重みを持ち、柔軟なデプロイメント、効率的なストレージ、優れた生成品質という特徴を備えています。
Qwen3-VLはアリババが発表した最新世代のビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力を備え、長いコンテキスト処理と動画理解をサポートし、指令最適化バージョンを提供します。
John6666
テキストから画像生成に特化したアニメスタイルのモデルで、可愛い女の子形象の2Dイラスト、人物肖像、キャラクター設定を生成できます。画像は動的なポーズ、明確な構造、強い照明などの特徴があります。
expert78
kontext-dusk-3-loraは、FLUX.1-Kontext-devベースモデルを基にトレーニングされたLoRA画像生成モデルで、黄昏のブルー調のスタイルの画像を生成するために特別に設計されています。このモデルは特定のトリガーワードで起動し、主流のAI画像生成ツールを複数サポートしています。
zambawi
joywan - loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画および画像生成タスクに特化しており、基礎モデルのWan - AI/Wan2.1 - T2V - 14B - Diffusersと併用する必要があります。
MartinSSSTSGH
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画への画像生成タスクに特化しており、トリガーワード「Lilly」を使用して特定のスタイルの画像コンテンツを生成します。
Isshywondertwin
Alexis_Noir_Wan2.2-loraは、OstrisによるAI Toolkitを使用して訓練されたLoRAモデルで、画像から動画への変換タスクに特化しています。このモデルはWan2.2-I2V-A14Bベースモデルに基づいており、高解像度画像の生成をサポートしています。
deadpoolx22
これはAI技術に基づくテキストから動画へのLoRAモデルで、アリタキャラクターに特化して最適化訓練されており、画像生成などのシーンに使用でき、関連分野のアプリケーションに便利をもたらします。
jude1903
AJWWan22-loraは、テキストから動画を生成するLoRAモデルで、AI Toolkitを使って訓練され、画像生成タスクに特化しています。このモデルは特定のトリガーワードを必要として、生成機能を活性化します。
fraemwerk
これはWan2.1-T2V-14Bモデルに基づくテキストから動画へのLoRAアダプターで、AIツールキットを使用してトレーニングされ、画像生成タスクに特化しており、特定のトリガーワード「fraemwerk」で生成機能をアクティブにする必要があります。
bigdoinks420518
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画への変換タスクに特化しています。モデルはWan2.2-T2V-A14Bアーキテクチャに基づいており、高解像度画像の生成をサポートしています。
zac
これはOstrisによるAIツールキットを基に訓練されたLoRAモデルで、画像から動画への変換タスクに特化しており、画像生成に新しい解決策を提供します。このモデルはQwen/Qwen-Imageベースモデルを基に構築され、画像生成にはJohnをトリガーワードとして使用します。
Hikarias
f3rnanda_wan22-loraは、OstrisによるAIツールキットを基に訓練されたLoRAモデルで、画像から動画への生成タスクに特化しています。このモデルはWan2.2 - I2V - A14Bをベースモデルとして使用し、ComfyUIやAUTOMATIC1111などの主流のAIツールでの使用をサポートしています。
FAL AIをベースにしたロゴ生成サーバーで、画像生成、背景除去、自動スケーリング機能を提供します。
Google Gemini APIをベースにしたMCPサーバーで、画像生成機能を提供し、テキストプロンプトによる画像作成をサポートし、生成された画像を自動的にImgBB画像ホスティングサービスにアップロードします。
FAL画像ビデオMCPサーバーは、高性能のMCPプロトコルサーバーで、FAL AIの画像およびビデオ生成に特化しており、ローカルマシンへの自動ダウンロードをサポートしています。ClaudeなどのMCP互換クライアントに適した公共URL、データURL、およびローカルファイルパスを提供します。
AIビデオ生成MCPサーバーは、テキストと画像入力をサポートして動画ビデオを生成し、様々なパラメーター制御とモデル選択を提供します。
完全なウェブサイトアイコンセットを自動生成するMCPサービスで、PNG画像またはURLからさまざまなサイズのfavicon、Appleタッチアイコン、およびウェブアプリケーションマニフェストファイルを作成できます。
OpenRouter APIに基づく自動コードドキュメント生成ツールで、コードライブラリのディレクトリ構造とファイル内容を分析し、自動的にドキュメント、テスト計画、およびコードレビューレポートを生成します。
これは、自然言語処理、画像生成から自動化ワークフローまで、複数の分野にまたがる多数のオープンソースAIプロジェクトのリストです。これらのプロジェクトは、開発者がAI技術を利用して、チャットボット、コード生成ツール、データ処理システムなどの様々なアプリケーションを構築するのを支援することを目的としています。
MCPプロトコルに基づくYouTube APIブリッジサーバーで、AIアシスタントが動画の字幕を取得し要約を生成するために使用されます。
MiniMax MCP JSは、JavaScript/TypeScriptで実装されたMiniMaxモデルコンテキストプロトコルツールキットで、テキスト読み上げ、画像生成、動画生成、声のクローンなどの機能を提供し、複数の設定方法と転送モードをサポートします。
Model Context Protocol (MCP)に基づくサービスで、YouTube動画から自動的に字幕を抽出し、専門的なLinkedIn投稿草稿を生成します。
ComfyUI MCPサーバーは、ComfyUIとMCPを統合するサービス実装で、動作中のComfyUIサーバーと併用する必要があります。テキストから画像の生成、画像のダウンロード、カスタムワークフローの実行などのさまざまな組み込みツールを提供し、UVまたはDocker方式での実行をサポートします。
OpenRouter APIに基づく自動コードドキュメント生成ツールで、コードリポジトリの構造と内容を分析して、ドキュメント、テスト計画、コードレビューレポートをインテリジェントに生成します。
Vidu MCPサーバーは、Model Context Protocolに基づくサーバーで、Vidu動画生成APIとやり取りし、画像から動画への変換、生成状態の確認、画像のアップロード機能を提供します。
モーダルMCPツールボックスは、Modalプラットフォーム上で動作するツールの集合で、モデルコンテキストプロトコル(MCP)に基づいており、LLMにPythonサンドボックスコード実行やFLUXモデルによる画像生成などの拡張機能を提供します。
Luma API MCPは画像と動画の生成サービスを提供するプロジェクトで、ユーザーはAPIキーを介してアクセスでき、複数のアスペクト比、モデル、解像度オプションをサポートし、参照画像や動画のキーフレームを通じて生成結果を制御できます。
このプロジェクトはMCPプロトコルとpython - pptxライブラリに基づくPPT作成サービスで、チャットインタラクションを通じてPowerPointプレゼンテーションを動的に作成、編集、保存することをサポートしています。スライドの追加、画像や表の挿入などの様々な機能を提供し、ダウンロードリンクを生成し、Base64形式でエクスポートすることもできます。
詳細な架空世界を構築するためのモデルコンテキストプロトコルで、自動画像生成をサポートします。
TypeScriptベースのMCPサーバーで、AI画像および動画生成機能を提供します。GPT4O Image GeneratorのAPIキーが必要です。
MiniMax MCP JSは、JavaScript/TypeScriptに基づいて実装されたMiniMax MCPプロトコルツールセットで、画像生成、動画生成、テキスト読み上げなどの機能を提供し、MCP互換クライアントとのやり取りをサポートします。