Rhymes AI lance Allegro-TI2V, un modèle révolutionnaire de génération de texte, d'image et de vidéo

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Nov 29, 2024

319

Rhymes AI a récemment lancé Allegro-TI2V, son modèle révolutionnaire de génération de vidéo à partir de texte et d'image. Cette avancée technologique ouvre de nouvelles perspectives pour la création de contenu numérique. Allegro-TI2V, fruit des dernières avancées en matière d'IA générative, offre aux créateurs d'outils de narration visuelle sans précédent, soulignant l'énorme potentiel de l'IA dans le domaine de la créativité.

Allegro-TI2V excelle sur plusieurs plans techniques : il prend en charge une longueur de contexte allant jusqu'à 79,2K, soit l'équivalent de 88 images vidéo. Sa résolution de sortie est de 720×1280 pixels, avec une vitesse de génération de 15 images par seconde. Les utilisateurs peuvent également choisir une interpolation à 30 FPS pour répondre aux besoins des différentes applications. L'architecture du modèle est très complexe, intégrant un VideoVAE de 175 millions de paramètres et un modèle VideoDiT de 2,8 milliards de paramètres, lui permettant de capturer avec précision l'essence des invites textuelles et de l'image initiale fournies par l'utilisateur. De plus, Allegro-TI2V prend en charge plusieurs modes de précision (FP32, BF16, FP16). En mode BF16, la génération vidéo ne nécessite que 9,3 Go de mémoire GPU, réduisant considérablement les exigences matérielles.

L'innovation d'Allegro-TI2V réside dans l'introduction de deux nouveaux modes de génération : Génération vidéo consécutive : création de contenu vidéo continu basé sur une invite textuelle et une image initiale. Ce mode permet aux créateurs de générer facilement des vidéos conformes à un thème et à un style définis. Génération vidéo intermédiaire : génération d'images intermédiaires avec une transition naturelle à partir des images de début et de fin d'une vidéo donnée, brisant les limites traditionnelles du temps et de l'espace dans le montage vidéo.

Ces modes innovants permettent à Allegro-TI2V d'offrir aux créateurs un processus de création vidéo plus efficace et plus flexible, améliorant considérablement l'efficacité et la qualité de la création.

Rhymes AI a publié Allegro-TI2V sous la licence Apache2.0, facilitant ainsi l'accès et l'utilisation de cette technologie pour les chercheurs, les développeurs et les créateurs de contenu. Il suffit d'installer Python3.10+, PyTorch2.4+ et CUDA12.4+ pour commencer à utiliser rapidement cette technologie de pointe.

Les perspectives d'application d'Allegro-TI2V sont extrêmement vastes, de la production cinématographique au développement de jeux vidéo, en passant par l'art numérique et les prototypes créatifs. Selon les données fournies par les développeurs, un seul GPU H100 peut générer 6 secondes de vidéo en environ 20 minutes, tandis qu'une configuration avec 8 GPU H100 réduit le temps de génération à 3 minutes, améliorant considérablement l'efficacité de la création de contenu vidéo.

Adresse d'utilisation : https://huggingface.co/rhymes-ai/Allegro-TI2V

Adresse du produit : https://rhymes.ai/blog-details/allegro-advanced-video-generation-model

RhymesAI Allegro-TI2V IA générative Génération vidéo

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

La société norvégienne de robots 1X lance son premier robot humanoïde destiné aux ménages, le Neo, au prix de 20 000 dollars, avec un abonnement mensuel de 499 dollars. Ce robot de 1,68 mètre est spécialement conçu pour des tâches ménagères comme laver la vaisselle ou ranger, et utilise un mode de collaboration entre l'IA et une assistance humaine à distance pour accomplir des tâches complexes.

Oct 29, 2025

210

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

La technologie IA connaît un développement rapide, le secteur du jeu vidéo est en pleine transformation. L'IA générative apporte de nouvelles opportunités et défis, Microsoft, Amazon et d'autres entreprises réorientent leurs ressources vers les applications de l'IA. Les développeurs de jeux ont des avis divergents sur ce sujet, et le futur de l'industrie reste incertain.

Oct 29, 2025

100

Magic Leap annonce un nouveau partenariat avec Google pour développer un prototype de lunettes AR de prochaine génération

Le 29 octobre, Magic Leap et Google ont annoncé un nouveau partenariat lors du Sommet des investissements dans l'avenir à Ryad, afin de développer ensemble un prototype de lunettes AR et d'avancer dans le domaine de la réalité augmentée. Ross Rosenburg, dirigeant de Magic Leap, a déclaré que l'entreprise passait du statut de pionnier en réalité augmentée à celui de partenaire d'écosystème, et qu'elle utiliserait son expertise en optique et affichage pour atteindre une nouvelle phase de son vision.

Oct 29, 2025

100

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Lors de la conférence GTC 2025, NVIDIA a présenté le « projet de conception Omniverse DSX », destiné spécifiquement aux centres de données AI de plusieurs milliards de watts. Ce projet est appelé l'« usine IA ». Cette solution repose sur le cadre Omniverse et prend en charge des configurations allant d'un à dix milliards de watts. Elle vise à former et à exécuter efficacement des modèles AI de grande taille, répondant ainsi à la croissance continue des besoins en calcul IA, représentant une avancée majeure dans les infrastructures d'intelligence artificielle.

Oct 29, 2025

200

Liao Qian, ancien responsable du produit AI de Jiansheng de Bytedance, lance son entreprise et lance un Agent multimodal de marketing

Liao Qian, ancien responsable du produit AI de Jiansheng de Bytedance, a fondé la société 'Contexte extrême', spécialisée dans le développement d'un Agent multimodal de marketing. Grâce à son expérience approfondie dans le domaine de l'AIGC, il a rapidement obtenu un financement initial de plusieurs millions de dollars. Liao Qian a travaillé chez Tencent et Bytedance, et s'est spécialisé dans les technologies AIGC depuis 2019, attirant ainsi l'attention de l'industrie.

Oct 29, 2025

Le modèle vocal SoulX-Podcast est officiellement lancé : une génération de podcasts sans interruption pendant 90 minutes, une révolution du vocal IA en phase d'upgrade

SoulX-Podcast, modèle vocal dédié aux podcasts, génère une voix haute fidélité. Supporte longs dialogues multilingues et multiclocuteurs avec stabilité sur 90+ minutes.....

Oct 29, 2025

Google lance un outil de marketing automatique par IA appelé Pomelli, qui génère du contenu de marketing en entrant l'URL d'un site web

Google Labs et DeepMind ont lancé ensemble l'outil d'IA Pomelli, en test public aux États-Unis, au Canada, en Australie et en Nouvelle-Zélande. Cet outil est destiné aux petites et moyennes entreprises, qui analyse intelligemment le contenu du site web pour créer rapidement des campagnes de marketing sur les réseaux sociaux conformes à l'identité de la marque, réduisant ainsi les barrières du marketing et permettant une création professionnelle de contenus. La fonction principale consiste en trois étapes pour construire l'ADN commercial.

Oct 29, 2025

190

Nvidia's Huang Renxun rejette la thèse de la bulle de l'IA, les nouvelles puces Nvidia devraient générer 500 milliards de dollars de chiffre d'affaires

Le PDG de Nvidia, Huang Renxun, a rejeté lors du congrès GTC à Washington la thèse d'une bulle sur le marché de l'intelligence artificielle. Il prévoit que les nouvelles puces Blackwell et Rubin généreront 500 milliards de dollars de revenus au cours des prochains trimestres, poussant l'entreprise dans une période de croissance sans précédent. C'est la première fois que Nvidia organise cet événement dans la capitale américaine.

Oct 29, 2025

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

OpenAI passe du non lucratif au commercial, cherchant activement des investissements pour accélérer sa croissance. Cette réorganisation renforce sa compétitivité sur le marché et a eu un impact significatif sur son partenaire Microsoft, qui a vu sa valeur boursière dépasser 4 000 milliards de dollars. L'utilisation généralisée des technologies comme ChatGPT est un facteur clé de cette poussée.

Oct 29, 2025

Adobe Firefly Image 5 : une mise à jour majeure : génération native de 4 millions de pixels, piste audio IA + modèles personnalisés, les créateurs entrent dans l'ère de la création artistique complète avec l'IA

Adobe lance le modèle de génération d'images IA professionnel Firefly Image5, marquant une transformation qualitative du ''suffisant'' vers le niveau professionnel. Les nouvelles fonctions comprennent une sortie native de 4 millions de pixels, un éditeur de commandes par couches, des modèles personnalisés de style artistique et une génération de musique d'accompagnement audio IA, fermant ainsi le cercle de la création artistique en IA pour les images, les vidéos et les audios, redéfinissant ainsi le flux de travail créatif.

Oct 29, 2025

180

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Rhymes AI lance Allegro-TI2V, un modèle révolutionnaire de génération de texte, d'image et de vidéo

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

Magic Leap annonce un nouveau partenariat avec Google pour développer un prototype de lunettes AR de prochaine génération

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Liao Qian, ancien responsable du produit AI de Jiansheng de Bytedance, lance son entreprise et lance un Agent multimodal de marketing

Le modèle vocal SoulX-Podcast est officiellement lancé : une génération de podcasts sans interruption pendant 90 minutes, une révolution du vocal IA en phase d'upgrade

Google lance un outil de marketing automatique par IA appelé Pomelli, qui génère du contenu de marketing en entrant l'URL d'un site web

Nvidia's Huang Renxun rejette la thèse de la bulle de l'IA, les nouvelles puces Nvidia devraient générer 500 milliards de dollars de chiffre d'affaires

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

Adobe Firefly Image 5 : une mise à jour majeure : génération native de 4 millions de pixels, piste audio IA + modèles personnalisés, les créateurs entrent dans l'ère de la création artistique complète avec l'IA

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

Magic Leap annonce un nouveau partenariat avec Google pour développer un prototype de lunettes AR de prochaine génération

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Liao Qian, ancien responsable du produit AI de Jiansheng de Bytedance, lance son entreprise et lance un Agent multimodal de marketing

Le modèle vocal SoulX-Podcast est officiellement lancé : une génération de podcasts sans interruption pendant 90 minutes, une révolution du vocal IA en phase d'upgrade

Google lance un outil de marketing automatique par IA appelé Pomelli, qui génère du contenu de marketing en entrant l'URL d'un site web

Nvidia's Huang Renxun rejette la thèse de la bulle de l'IA, les nouvelles puces Nvidia devraient générer 500 milliards de dollars de chiffre d'affaires

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

Adobe Firefly Image 5 : une mise à jour majeure : génération native de 4 millions de pixels, piste audio IA + modèles personnalisés, les créateurs entrent dans l'ère de la création artistique complète avec l'IA

GEO Services