腾讯元宝が新機能をリリース。一言または画像1枚で動画を生成可能。HunyuanVideo1.5モデルを基に、動画制作を簡素化。....
腾讯は軽量動画生成モデルHunyuanVideo1.5を発表。DiTアーキテクチャ採用、8.3Bパラメータで5-10秒の高画質動画を生成可能。プラットフォーム「元宝」で公開され、テキスト入力や画像+テキストからの動画生成機能を提供。....
ウィキペディアが『AI執筆識別ガイド』を発表し、大規模言語モデルの文章行動の特徴を系統的に明らかにし、実用的なAIテキストの識別の方法を提供しています。このガイドは2023年に開始されたAIクリーンアップ計画に基づいており、頻出語だけに頼るのではなく、システム的特徴によってAI生成コンテンツを識別することを強調しています。
QuoraのAIプラットフォームであるPoeがチャットルーム機能を発表しました。最大200人が同時に複数のAIモデルと対話できる仕組みで、テキスト、画像、動画、音声の生成にも対応しています。この機能はOpenAIによるChatGPTのグループチャット試験と同時期にリリースされ、AIとのインタラクションの変革を推進し、ユーザー同士や家族、同僚との協力的なコミュニケーションを強化します。
無料のAI動画生成ツールで、画像を動画に数秒で変換でき、複数のトップレベルのAIモデルをサポートしています。
AIデザインエージェントを通じて、プロフェッショナルな画像、動画、3Dモデルを迅速に生成できます。
騰訊の混元3Dで駆動される画像から3DとSTLへの変換ツール。高精度の3Dモデルを迅速に生成します。
LTX-2 はマルチモーダル AI 動画生成モデルです。
google
$0.72
入力トークン/百万
$2.88
出力トークン/百万
1M
コンテキスト長
unsloth
Qwen3-VL-32B-ThinkingはQwenシリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長文脈処理、空間および動画の動的理解能力、そして優れたエージェント対話能力を備えています。
Qwen
Qwen3-VL-2B-Instruct-GGUFは通義千問シリーズのマルチモーダルビジュアル言語モデルのGGUF量子化バージョンで、20億のパラメータを持ち、画像理解とテキスト生成のシームレスな融合をサポートし、CPUやGPUなどのデバイスで効率的に動作します。
Qwen3-VLはこれまでのQwenシリーズで最も強力なビジュアル言語モデルで、テキスト理解と生成、ビジュアル認識と推論、コンテキスト長、空間と動画の動的理解、エージェントの対話能力などの面で全面的にアップグレードされています。このモデルはハイブリッドエキスパート(MoE)アーキテクチャを採用し、卓越したマルチモーダル処理能力を提供します。
Qwen3-VLはQwenシリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認識と推論能力、長文脈のサポート、強力な空間と動画の動的理解能力、そして優れたエージェント対話能力を備えています。
bartowski
これはQwen3-VL-2B-Instructモデルの量子化バージョンで、llama.cppツールとimatrix方法を使用して、さまざまな量子化レベルのモデルファイルを生成し、さまざまなハードウェア環境で高効率に動作させることができます。このモデルは20億パラメータのマルチモーダルビジュアル言語モデルで、画像とテキストの相互作用をサポートしています。
Qwen3-VLはQwenシリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長いコンテキストサポート、強力な空間と動画の動的理解能力、そして優れたエージェント対話能力を備えています。
Qwen3-VLは通義シリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長いコンテキストサポート、強力な空間と動画の動的理解能力、そして優れたエージェント対話能力を備えています。
jayn7
このプロジェクトは、LightX2Vチームによって開発された万2.2蒸留モデルの量子化GGUFバージョンを提供しています。これは、画像から動画への変換や動画生成タスクに特化しています。このバージョンは最適化されており、ComfyUI - GGUFなどのツールと連携して、効率的な推論性能を提供します。
lightx2v
LoRAに基づく4ステップ推論の高性能動画生成モデルで、Wan2.2蒸留モデルから抽出されたLoRA重みを持ち、柔軟なデプロイメント、効率的なストレージ、優れた生成品質という特徴を備えています。
Qwen3-VLはアリババが発表した最新世代のビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力を備え、長いコンテキスト処理と動画理解をサポートし、指令最適化バージョンを提供します。
John6666
テキストから画像生成に特化したアニメスタイルのモデルで、可愛い女の子形象の2Dイラスト、人物肖像、キャラクター設定を生成できます。画像は動的なポーズ、明確な構造、強い照明などの特徴があります。
expert78
kontext-dusk-3-loraは、FLUX.1-Kontext-devベースモデルを基にトレーニングされたLoRA画像生成モデルで、黄昏のブルー調のスタイルの画像を生成するために特別に設計されています。このモデルは特定のトリガーワードで起動し、主流のAI画像生成ツールを複数サポートしています。
zambawi
joywan - loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画および画像生成タスクに特化しており、基礎モデルのWan - AI/Wan2.1 - T2V - 14B - Diffusersと併用する必要があります。
MartinSSSTSGH
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画への画像生成タスクに特化しており、トリガーワード「Lilly」を使用して特定のスタイルの画像コンテンツを生成します。
Isshywondertwin
Alexis_Noir_Wan2.2-loraは、OstrisによるAI Toolkitを使用して訓練されたLoRAモデルで、画像から動画への変換タスクに特化しています。このモデルはWan2.2-I2V-A14Bベースモデルに基づいており、高解像度画像の生成をサポートしています。
deadpoolx22
これはAI技術に基づくテキストから動画へのLoRAモデルで、アリタキャラクターに特化して最適化訓練されており、画像生成などのシーンに使用でき、関連分野のアプリケーションに便利をもたらします。
jude1903
AJWWan22-loraは、テキストから動画を生成するLoRAモデルで、AI Toolkitを使って訓練され、画像生成タスクに特化しています。このモデルは特定のトリガーワードを必要として、生成機能を活性化します。
fraemwerk
これはWan2.1-T2V-14Bモデルに基づくテキストから動画へのLoRAアダプターで、AIツールキットを使用してトレーニングされ、画像生成タスクに特化しており、特定のトリガーワード「fraemwerk」で生成機能をアクティブにする必要があります。
bigdoinks420518
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画への変換タスクに特化しています。モデルはWan2.2-T2V-A14Bアーキテクチャに基づいており、高解像度画像の生成をサポートしています。
zac
これはOstrisによるAIツールキットを基に訓練されたLoRAモデルで、画像から動画への変換タスクに特化しており、画像生成に新しい解決策を提供します。このモデルはQwen/Qwen-Imageベースモデルを基に構築され、画像生成にはJohnをトリガーワードとして使用します。
AIビデオ生成MCPサーバーは、テキストと画像入力をサポートして動画ビデオを生成し、様々なパラメーター制御とモデル選択を提供します。
MiniMax MCP JSは、JavaScript/TypeScriptで実装されたMiniMaxモデルコンテキストプロトコルツールキットで、テキスト読み上げ、画像生成、動画生成、声のクローンなどの機能を提供し、複数の設定方法と転送モードをサポートします。
Luma API MCPは画像と動画の生成サービスを提供するプロジェクトで、ユーザーはAPIキーを介してアクセスでき、複数のアスペクト比、モデル、解像度オプションをサポートし、参照画像や動画のキーフレームを通じて生成結果を制御できます。
モーダルMCPツールボックスは、Modalプラットフォーム上で動作するツールの集合で、モデルコンテキストプロトコル(MCP)に基づいており、LLMにPythonサンドボックスコード実行やFLUXモデルによる画像生成などの拡張機能を提供します。
詳細な架空世界を構築するためのモデルコンテキストプロトコルで、自動画像生成をサポートします。
これは、複数のオープンソースAIプロジェクトのリストで、自動化エージェント、大規模言語モデル、画像生成からAI開発フレームワークまで、複数の分野をカバーしています。これらのプロジェクトは、開発者がAI技術を活用して収益を上げるのを支援することを目的としており、スマートアシスタントの構築、自動化ワークフロー、コンテンツ生成などのアプリケーションが含まれます。