字节跳动と清華大学がHuMoというオープンソースフレームワークを共同開発。テキスト、画像、音声のマルチモーダル入力に対応し、高品質な人体動画を生成可能。....
Alissonerdx
HuMoは統一的で人を中心としたビデオ生成フレームワークで、テキスト、画像、音声などのマルチモーダル入力に基づいて、高品質、細粒度で制御可能な人間のビデオを生成できます。強力なテキストプロンプト追従、一貫した主体保持、同期した音声駆動型モーションをサポートします。
VeryAladeen
HuMoは人を中心としたビデオ生成フレームワークで、テキスト、画像、音声などのマルチモーダル入力を利用して、高品質、細粒度で制御可能な人間のビデオを生成することができます。テキストプロンプトの追従、主体の保持、音声駆動運動の同期をサポートします。
njwright92
ComicBotはMistral 7B v2をファインチューニングしたコメディコンテンツ生成・分析AIモデルで、Humor Hubアプリ専用に設計されています。ジョークの創作、笑いのポイントの最適化、コメディコンテンツの推薦が可能です。
mohameddhiab
distilbert-base-uncasedをファインチューニングしたユーモア検出モデルで、評価データセットでF1スコア0.9537を達成