ミートゥー・デザインルームはビデオ創作の大規模モデルであるSeedance2.0に接続し、AI技術を深く統合してEC動画の生産を最適化しました。今回のアップグレードでは高精度な生成能力をECシーンに応用し、商家に対して製品展示、仮想着用からコスメーションへの全行程の動画コンテンツソリューションを提供し、AIの商業化を推進します。
DeepSeekは来週、マルチモーダル大規模モデルV4を発表する予定です。このモデルは画像、動画、テキストの生成をサポートしています。このモデルはすべての中国製算力と互換性があり、中国製半導体チップとの適合性を最適化することを目的としています。このモデルは国内半導体需要の促進と、AI推論および中国製チップの統合を加速する可能性があります。
AI生成の「神医」動画がSNSで氾濫。誇張された症状と即時「治癒」を演出する奇抜な内容が量産され、不快感と疑問を引き起こしている。....
AI動画生成は、ランダム性の高い「ブラインドボックス」段階から実用化へ移行中。Soraは業界に不安をもたらしたが、映像の不連続性などの問題が工業化を妨げている。万興劇場プラットフォームはプロセス再構築により、AI動画をデモの「おもちゃ」から信頼性の高い「生産ツール」へ進化させ、連続性と制御性の課題解決を目指す。....
無料のAI画像および動画生成プラットフォームで、創作の可能性を無限に広げます。
無料で強力なAI画像と動画作成プラットフォームで、登録不要で、無制限に高品質な作品を生成できます。
バナナ2はナノバナナ2によって駆動されるAI画像生成器で、4Kの視覚効果を作成することができます。
AI唇同期動画生成ツールで、長い音声をリアルな口パク同期動画に変換できます。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$6
$24
256
Baidu
128
$4
$16
Bytedance
$1.2
$3.6
4
expert78
kontext-dusk-3-loraは、FLUX.1-Kontext-devベースモデルを基にトレーニングされたLoRA画像生成モデルで、黄昏のブルー調のスタイルの画像を生成するために特別に設計されています。このモデルは特定のトリガーワードで起動し、主流のAI画像生成ツールを複数サポートしています。
zambawi
joywan - loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画および画像生成タスクに特化しており、基礎モデルのWan - AI/Wan2.1 - T2V - 14B - Diffusersと併用する必要があります。
MartinSSSTSGH
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画への画像生成タスクに特化しており、トリガーワード「Lilly」を使用して特定のスタイルの画像コンテンツを生成します。
Isshywondertwin
Alexis_Noir_Wan2.2-loraは、OstrisによるAI Toolkitを使用して訓練されたLoRAモデルで、画像から動画への変換タスクに特化しています。このモデルはWan2.2-I2V-A14Bベースモデルに基づいており、高解像度画像の生成をサポートしています。
deadpoolx22
これはAI技術に基づくテキストから動画へのLoRAモデルで、アリタキャラクターに特化して最適化訓練されており、画像生成などのシーンに使用でき、関連分野のアプリケーションに便利をもたらします。
jude1903
AJWWan22-loraは、テキストから動画を生成するLoRAモデルで、AI Toolkitを使って訓練され、画像生成タスクに特化しています。このモデルは特定のトリガーワードを必要として、生成機能を活性化します。
fraemwerk
これはWan2.1-T2V-14Bモデルに基づくテキストから動画へのLoRAアダプターで、AIツールキットを使用してトレーニングされ、画像生成タスクに特化しており、特定のトリガーワード「fraemwerk」で生成機能をアクティブにする必要があります。
bigdoinks420518
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画への変換タスクに特化しています。モデルはWan2.2-T2V-A14Bアーキテクチャに基づいており、高解像度画像の生成をサポートしています。
zac
これはOstrisによるAIツールキットを基に訓練されたLoRAモデルで、画像から動画への変換タスクに特化しており、画像生成に新しい解決策を提供します。このモデルはQwen/Qwen-Imageベースモデルを基に構築され、画像生成にはJohnをトリガーワードとして使用します。
Hikarias
f3rnanda_wan22-loraは、OstrisによるAIツールキットを基に訓練されたLoRAモデルで、画像から動画への生成タスクに特化しています。このモデルはWan2.2 - I2V - A14Bをベースモデルとして使用し、ComfyUIやAUTOMATIC1111などの主流のAIツールでの使用をサポートしています。
lichorosario
piccoli_no_style-loraは、画像から動画への変換、LoRA技術に基づく生成モデルで、AI Toolkitを使用して訓練され、Qwen/Qwen-Imageをベースモデルとして、さまざまな画像生成シーンをサポートします。
piccoli_no_style-loraは、画像から動画への技術に基づくLoRAモデルで、AI Toolkitを使用してトレーニングされ、主に画像生成タスクに使用され、複数の主流のAIツールと連携できます。
trinty2535425
これはQwen/Qwen-Image基礎モデルに基づいて訓練された画像から動画へのLoRAモデルで、LoRA(Low-Rank Adaptation)技術を用いて効率的な微調整を実現し、AI画像生成などの関連タスクに使用できます。
nvidia
Cosmos-Predict2.5はNVIDIAが開発した、物理AI向けに設計された高性能の事前学習済み世界基礎モデルセットです。拡散モデル技術に基づいており、テキスト、画像、またはビデオの入力に基づいて、物理的な知覚を持つ高品質の画像とビデオを生成することができ、自動運転やロボットなどのアプリケーションに世界シミュレーション能力を提供します。
unsloth
Cosmos-Reason1はNVIDIAが開発した物理人工知能モデルで、物理常識を理解する能力を備え、長鎖思考推論により具身決定を生成できます。このモデルはマルチモーダル入力(テキスト + ビデオ/画像)をサポートし、出力はテキストで、ロボットや自動運転などの物理AI分野に適しています。
zai-org
CogVideoX1.5-5Bは智譜AIがオープンソースで公開したテキストから動画を生成するモデルで、英語のテキスト記述に基づいて高品質の動画を生成することができます。このモデルは1360×768の解像度、最大81フレーム(5秒)の動画生成をサポートしており、動画作成分野で幅広い応用価値を持っています。
rd690
rd690によってNxtWaveの「自分自身のGen AIモデルを構築する」コースで訓練されたテキストから画像を生成するモデルで、動物テーマの画像生成に特化しています。
FAL AIをベースにしたロゴ生成サーバーで、画像生成、背景除去、自動スケーリング機能を提供します。
FAL画像ビデオMCPサーバーは、高性能のMCPプロトコルサーバーで、FAL AIの画像およびビデオ生成に特化しており、ローカルマシンへの自動ダウンロードをサポートしています。ClaudeなどのMCP互換クライアントに適した公共URL、データURL、およびローカルファイルパスを提供します。
AIビデオ生成MCPサーバーは、テキストと画像入力をサポートして動画ビデオを生成し、様々なパラメーター制御とモデル選択を提供します。
これは、自然言語処理、画像生成から自動化ワークフローまで、複数の分野にまたがる多数のオープンソースAIプロジェクトのリストです。これらのプロジェクトは、開発者がAI技術を利用して、チャットボット、コード生成ツール、データ処理システムなどの様々なアプリケーションを構築するのを支援することを目的としています。
MCPプロトコルに基づくYouTube APIブリッジサーバーで、AIアシスタントが動画の字幕を取得し要約を生成するために使用されます。
TypeScriptベースのMCPサーバーで、AI画像および動画生成機能を提供します。GPT4O Image GeneratorのAPIキーが必要です。
awesome - mcpは、MCP(Model Context Protocol)サーバーを収集して共有するプロジェクトで、AI、データベース、ブラウザ自動化、コード管理、画像生成、検索、ストレージなどのさまざまな分野の公式およびコミュニティ貢献によるMCPサーバーの実装を網羅しています。
TypeScriptに基づくMCPサーバーで、AI画像と動画生成機能を提供し、GPT4O Image GeneratorのAPIキーが必要です。
MCP URL2SNAPは、軽量のModel Context Protocol (MCP)サーバーで、LLMが指定したURLを通じてウェブページのスクリーンショットを取得し、画像のアクセスリンクを返すことができます。このプロジェクトは、ウェブページのスナップショットの生成と共有プロセスを簡素化し、Claude DesktopなどのAIアプリケーションや自動化ワークフローに統合するのに適しています。
SVGMaker MCPサーバーは、SVGMaker APIに基づく強力なサービスで、SVG画像の生成、編集、変換に使用されます。AI駆動のSVG作成、スマート編集、画像のSVG変換などの機能をサポートし、安全なファイル操作とリアルタイムの進捗更新を提供します。
これは、複数のオープンソースAIプロジェクトのリストで、自動化エージェント、大規模言語モデル、画像生成からAI開発フレームワークまで、複数の分野をカバーしています。これらのプロジェクトは、開発者がAI技術を活用して収益を上げるのを支援することを目的としており、スマートアシスタントの構築、自動化ワークフロー、コンテンツ生成などのアプリケーションが含まれます。
Streamlitベースのスマートチャットボットで、GPT - 4oを使用してユーザーのリクエストをチャット、画像生成、データベースクエリ、音声合成などのさまざまなツールに自動ルーティングし、AIツールのルーティング機能を迅速に実験できます。
Orshot MCPサーバーは画像生成APIサービスで、ユーザーがAPIを通じて事前に設計されたまたはAIで生成されたテンプレートから動的に画像を生成でき、ClaudeやCursorなどのアプリケーションでMCPサーバーを介して呼び出すことをサポートしています。
MCPプロトコルに基づく豆包Seedream 4.0文章から画像へのサーバーで、AI画像生成、自動ダウンロード、ローカル保存をサポートし、Claude Codeに統合して使用できます。
これはMCPプロトコル標準に準拠したサーバープロジェクトで、AI駆動のドキュメント生成サービスを提供し、PDF、Word、PPT、Excelなどの複数の形式に対応し、非同期処理、画像埋め込み、レイアウト検証などの機能を備えており、さまざまなAIホストに統合できます。
YouTubeを検索可能な知識源に変換するMCPサービスで、動画検索、詳細情報の取得、コンテンツ分析などの機能を提供し、AIを使用した要約生成、学習パスの計画などの高度な操作をサポートします。