ClipSketch AIは、動画を手描き風ストーリーボードに変換し、SNS向け文案を自動生成するオープンソースツールです。BilibiliやREDなどのリンク解析機能で、コンテンツ制作を効率化します。....
ByteDanceとNTUが開発したオープンソースフレームワーク「StoryMem」は、革新的な「視覚的記憶」メカニズムにより、単一ショット動画生成モデルをマルチショット長編動画生成ツールに進化させ、1分以上の自然なカット割りでキャラクターとシーンの一貫性を保つ物語動画を自動生成し、オープンソースAI動画技術の映画級ナラティブへの発展を促進します。....
YouTubeの新規ユーザー向け推奨動画の20%以上が、AI生成の「ジャンクコンテンツ」であることが判明。1.5万チャンネルを調査した結果、278チャンネルがAIコンテンツを専門に配信し、総再生回数630億回、収益は年間約1.17億ドルに上る。....
クアンカーマンガは「AIキャストインタラクティブマンガ」をリリースしました。AI技術を使ってマンガキャラクターを「生きている」ようにするこの製品は、マンガ業界がAI体験の第4のトレンドに入ることを示しています。この製品はMiniMaxによって技術支援され、動画と音声生成モデルを統合し、ユーザーに没入型のインタラクティブ体験を提供します。
無料で透かしのない画像から動画へのAIツールで、登録不要で、高品質の動画を迅速に生成します。
CUTY AIは統合型のビジュアルコンテンツ生成プラットフォームで、AIを使って画像や動画を作成します。
AI駆動の画像生成ツールで、瞬時に4枚の高画質画像を生成します。毎日無料のクォータがあり、複数のモデルから選べます。
LoovaはトップレベルのAIモデルを統合しており、文章から動画、画像から動画などの生成をサポートし、様々なエフェクトでクリエイティビティを向上させます。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$6
$24
256
Baidu
128
$4
$16
Bytedance
$1.2
$3.6
4
expert78
kontext-dusk-3-loraは、FLUX.1-Kontext-devベースモデルを基にトレーニングされたLoRA画像生成モデルで、黄昏のブルー調のスタイルの画像を生成するために特別に設計されています。このモデルは特定のトリガーワードで起動し、主流のAI画像生成ツールを複数サポートしています。
zambawi
joywan - loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画および画像生成タスクに特化しており、基礎モデルのWan - AI/Wan2.1 - T2V - 14B - Diffusersと併用する必要があります。
MartinSSSTSGH
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画への画像生成タスクに特化しており、トリガーワード「Lilly」を使用して特定のスタイルの画像コンテンツを生成します。
Isshywondertwin
Alexis_Noir_Wan2.2-loraは、OstrisによるAI Toolkitを使用して訓練されたLoRAモデルで、画像から動画への変換タスクに特化しています。このモデルはWan2.2-I2V-A14Bベースモデルに基づいており、高解像度画像の生成をサポートしています。
deadpoolx22
これはAI技術に基づくテキストから動画へのLoRAモデルで、アリタキャラクターに特化して最適化訓練されており、画像生成などのシーンに使用でき、関連分野のアプリケーションに便利をもたらします。
jude1903
AJWWan22-loraは、テキストから動画を生成するLoRAモデルで、AI Toolkitを使って訓練され、画像生成タスクに特化しています。このモデルは特定のトリガーワードを必要として、生成機能を活性化します。
fraemwerk
これはWan2.1-T2V-14Bモデルに基づくテキストから動画へのLoRAアダプターで、AIツールキットを使用してトレーニングされ、画像生成タスクに特化しており、特定のトリガーワード「fraemwerk」で生成機能をアクティブにする必要があります。
bigdoinks420518
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画への変換タスクに特化しています。モデルはWan2.2-T2V-A14Bアーキテクチャに基づいており、高解像度画像の生成をサポートしています。
zac
これはOstrisによるAIツールキットを基に訓練されたLoRAモデルで、画像から動画への変換タスクに特化しており、画像生成に新しい解決策を提供します。このモデルはQwen/Qwen-Imageベースモデルを基に構築され、画像生成にはJohnをトリガーワードとして使用します。
Hikarias
f3rnanda_wan22-loraは、OstrisによるAIツールキットを基に訓練されたLoRAモデルで、画像から動画への生成タスクに特化しています。このモデルはWan2.2 - I2V - A14Bをベースモデルとして使用し、ComfyUIやAUTOMATIC1111などの主流のAIツールでの使用をサポートしています。
lichorosario
piccoli_no_style-loraは、画像から動画への変換、LoRA技術に基づく生成モデルで、AI Toolkitを使用して訓練され、Qwen/Qwen-Imageをベースモデルとして、さまざまな画像生成シーンをサポートします。
piccoli_no_style-loraは、画像から動画への技術に基づくLoRAモデルで、AI Toolkitを使用してトレーニングされ、主に画像生成タスクに使用され、複数の主流のAIツールと連携できます。
trinty2535425
これはQwen/Qwen-Image基礎モデルに基づいて訓練された画像から動画へのLoRAモデルで、LoRA(Low-Rank Adaptation)技術を用いて効率的な微調整を実現し、AI画像生成などの関連タスクに使用できます。
nvidia
Cosmos-Predict2.5はNVIDIAが開発した、物理AI向けに設計された高性能の事前学習済み世界基礎モデルセットです。拡散モデル技術に基づいており、テキスト、画像、またはビデオの入力に基づいて、物理的な知覚を持つ高品質の画像とビデオを生成することができ、自動運転やロボットなどのアプリケーションに世界シミュレーション能力を提供します。
unsloth
Cosmos-Reason1はNVIDIAが開発した物理人工知能モデルで、物理常識を理解する能力を備え、長鎖思考推論により具身決定を生成できます。このモデルはマルチモーダル入力(テキスト + ビデオ/画像)をサポートし、出力はテキストで、ロボットや自動運転などの物理AI分野に適しています。
zai-org
CogVideoX1.5-5Bは智譜AIがオープンソースで公開したテキストから動画を生成するモデルで、英語のテキスト記述に基づいて高品質の動画を生成することができます。このモデルは1360×768の解像度、最大81フレーム(5秒)の動画生成をサポートしており、動画作成分野で幅広い応用価値を持っています。
rd690
rd690によってNxtWaveの「自分自身のGen AIモデルを構築する」コースで訓練されたテキストから画像を生成するモデルで、動物テーマの画像生成に特化しています。
FAL AIをベースにしたロゴ生成サーバーで、画像生成、背景除去、自動スケーリング機能を提供します。
FAL画像ビデオMCPサーバーは、高性能のMCPプロトコルサーバーで、FAL AIの画像およびビデオ生成に特化しており、ローカルマシンへの自動ダウンロードをサポートしています。ClaudeなどのMCP互換クライアントに適した公共URL、データURL、およびローカルファイルパスを提供します。
AIビデオ生成MCPサーバーは、テキストと画像入力をサポートして動画ビデオを生成し、様々なパラメーター制御とモデル選択を提供します。
MCPプロトコルに基づくYouTube APIブリッジサーバーで、AIアシスタントが動画の字幕を取得し要約を生成するために使用されます。
これは、自然言語処理、画像生成から自動化ワークフローまで、複数の分野にまたがる多数のオープンソースAIプロジェクトのリストです。これらのプロジェクトは、開発者がAI技術を利用して、チャットボット、コード生成ツール、データ処理システムなどの様々なアプリケーションを構築するのを支援することを目的としています。
TypeScriptベースのMCPサーバーで、AI画像および動画生成機能を提供します。GPT4O Image GeneratorのAPIキーが必要です。
awesome - mcpは、MCP(Model Context Protocol)サーバーを収集して共有するプロジェクトで、AI、データベース、ブラウザ自動化、コード管理、画像生成、検索、ストレージなどのさまざまな分野の公式およびコミュニティ貢献によるMCPサーバーの実装を網羅しています。
MCP URL2SNAPは、軽量のModel Context Protocol (MCP)サーバーで、LLMが指定したURLを通じてウェブページのスクリーンショットを取得し、画像のアクセスリンクを返すことができます。このプロジェクトは、ウェブページのスナップショットの生成と共有プロセスを簡素化し、Claude DesktopなどのAIアプリケーションや自動化ワークフローに統合するのに適しています。
TypeScriptに基づくMCPサーバーで、AI画像と動画生成機能を提供し、GPT4O Image GeneratorのAPIキーが必要です。
SVGMaker MCPサーバーは、SVGMaker APIに基づく強力なサービスで、SVG画像の生成、編集、変換に使用されます。AI駆動のSVG作成、スマート編集、画像のSVG変換などの機能をサポートし、安全なファイル操作とリアルタイムの進捗更新を提供します。
これは、複数のオープンソースAIプロジェクトのリストで、自動化エージェント、大規模言語モデル、画像生成からAI開発フレームワークまで、複数の分野をカバーしています。これらのプロジェクトは、開発者がAI技術を活用して収益を上げるのを支援することを目的としており、スマートアシスタントの構築、自動化ワークフロー、コンテンツ生成などのアプリケーションが含まれます。
Streamlitベースのスマートチャットボットで、GPT - 4oを使用してユーザーのリクエストをチャット、画像生成、データベースクエリ、音声合成などのさまざまなツールに自動ルーティングし、AIツールのルーティング機能を迅速に実験できます。
MCPプロトコルに基づく豆包Seedream 4.0文章から画像へのサーバーで、AI画像生成、自動ダウンロード、ローカル保存をサポートし、Claude Codeに統合して使用できます。
Orshot MCPサーバーは画像生成APIサービスで、ユーザーがAPIを通じて事前に設計されたまたはAIで生成されたテンプレートから動的に画像を生成でき、ClaudeやCursorなどのアプリケーションでMCPサーバーを介して呼び出すことをサポートしています。
これはMCPプロトコル標準に準拠したサーバープロジェクトで、AI駆動のドキュメント生成サービスを提供し、PDF、Word、PPT、Excelなどの複数の形式に対応し、非同期処理、画像埋め込み、レイアウト検証などの機能を備えており、さまざまなAIホストに統合できます。
YouTubeを検索可能な知識源に変換するMCPサービスで、動画検索、詳細情報の取得、コンテンツ分析などの機能を提供し、AIを使用した要約生成、学習パスの計画などの高度な操作をサポートします。