腾讯元宝が新機能をリリース。一言または画像1枚で動画を生成可能。HunyuanVideo1.5モデルを基に、動画制作を簡素化。....
元宝が「一言で動画生成」機能をリリース。テキストや画像入力だけで簡単に動画を作成可能。TencentのHunyuanVideo1.5を基に、初心者でも動画制作が容易に。....
騰訊元宝が新機能をリリースし、ユーザーは一文または一枚の画像だけで高解像度のビデオを生成できます。HunyuanVideo1.5オープンソースモデルを基盤とし、DiTアーキテクチャを採用し、パラメータ数8.3億個で、5〜10秒間のビデオ生成をサポートし、コンテンツ制作プロセスを簡素化します。
腾讯は軽量動画生成モデルHunyuanVideo1.5を発表。DiTアーキテクチャ採用、8.3Bパラメータで5-10秒の高画質動画を生成可能。プラットフォーム「元宝」で公開され、テキスト入力や画像+テキストからの動画生成機能を提供。....
HunyuanVideo-I2Vは、テンセントがHunyuanVideoに基づいて開発した、画像から動画を生成するフレームワークです。
これはHunyuanVideoモデルに基づくアダプターであり、キーフレームベースのビデオ生成に使用されます。
HunyuanVideoベースの動画生成ツールで、画像から動画への変換(IP2V)をサポートします。
動画処理インターフェースで、動画のエンコードとデコード機能を提供します。
lightx2v
このリポジトリには、HunyuanVideo-1.5用に最適化された4ステップ蒸留モデルが含まれています。このモデルは、CFG(分類器なしガイダンス)を使用せずに、超高速の4ステップ推論を実現し、生成時間を大幅に削減すると同時に、高品質のビデオ出力を維持します。
jayn7
騰訊の混元ビデオ1.5モデルの量子化GGUFバージョンで、テキストから動画生成タスクに特化しており、720P高画質動画生成をサポートし、使用効率を最適化するための複数の量子化精度バージョンを提供します。
このプロジェクトは、テンセントの混元ビデオ1.5のテキストから動画へのモデルの量子化GGUFバージョンを提供し、480P動画生成タスクをサポートします。蒸留モデルと完全モデルの2つのバージョンが含まれており、ComfyUI - GGUFなどのツールと連携して使用できます。
このプロジェクトでは、騰訊のHunyuanVideo-1.5-I2V-720pモデルの量子化GGUFバージョンを提供しており、画像を動画に変換するタスクや動画生成タスクに特化しています。このモデルは、静止画像を高品質な動画コンテンツに変換することができ、性能を最適化するための複数の量子化バージョンを提供しています。
騰訊の混元ビデオ1.5モデルの量子化GGUFバージョンで、画像を動画に変換するタスクや動画生成タスクに特化しています。480P解像度の蒸留モデルと標準モデルを提供し、Q4_K_S、Q8_0、FP16などの複数の量子化精度をサポートします。
HunyuanVideo-1.5用に最適化された量子化モデルで、LightX2Vフレームワークと組み合わせて使用することで、メモリ使用量を大幅に削減しながら、高品質のビデオ生成性能を維持します。
tencent
混元ビデオ - 1.5は軽量級で高性能なビデオ生成モデルで、わずか83億のパラメータでトップレベルのビデオ品質を提供し、使用の敷居を大幅に下げます。消費者向けGPUでスムーズに動作し、テキストからビデオ、画像からビデオの生成をサポートし、すべての開発者やクリエイターが簡単に使用できます。
hunyuanvideo-community
HunyuanImage-2.1 画像リファイナーは、diffusersライブラリに基づいて構築された画像から画像への変換モデルで、入力画像を特定のスタイルの画像に変換することができ、高品質な画像生成とスタイル変換をサポートします。
混元画像2.1はdiffusersライブラリに基づくテキストから画像生成モデルで、テキスト記述に基づいて高品質な画像を生成でき、中英語の入力をサポートし、ユーザーに便利な画像生成体験を提供します。
trojblue
テンセント混元動画ベースモデルをファインチューニングしたLoRAモデルで、アニメスタイルのピクセルアート画像生成に特化しており、キャラクターの動きやピクセル化されたシーンの表現が得意です。
TencentのHunyuanVideo-I2Vは、Diffusersベースの画像から動画への変換モデルで、静止画像を動画に変換できます。
混元ビデオ - I2Vは、全く新しい画像から動画への生成フレームワークで、騰訊の混元ビデオモデルを拡張したもので、静止画像から高品質の動画コンテンツを生成することができます。
jbilcke-hf
Tencent混元ビデオはテキストから動画を生成するモデルで、Hugging Face推論エンドポイントに対応しています。
city96
Tencent幻影動画モデルのGGUF量子化バージョン、ComfyUI専用設計、テキストから動画生成タスク用
FastVideo
FastHunyuanはHunyuanVideoの高速化バージョンで、わずか6ステップの拡散サンプリングで高品質な動画を生成可能。オリジナル版と比較して約8倍の速度向上を実現。
混元ビデオは騰訊がオープンソースした大規模ビデオ生成モデルで、革新的な統一アーキテクチャを採用して高品質のテキストからビデオへの生成を実現します。
テンセントがオープンソース化した大規模動画生成モデルで、テキストから動画を生成可能、主要なクローズドソースモデルに匹敵する性能を実現。