El Instituto de Ciencia y Tecnología de China y ByteDance presentan el modelo de generación de videos largos MoGA: generación de cortos con múltiples escenas en un solo clic en minutos

AIbase基地

Publié leActualités IA · 4 minutes de lecture · Oct 24, 2025

La Universidad de Ciencia y Tecnología de China y ByteDance están a punto de lanzar un modelo de generación de videos de largo alcance con un hito significativo. Este modelo puede generar directamente videos de alta calidad con una duración de minutos, resolución de 480p y 24 cuadros por segundo (fps), y admite cambios de escena múltiples, marcando un avance clave en la tecnología de generación de videos nacional en la competencia global de inteligencia artificial generativa.

La innovación central de este logro radica en su algoritmo subyacente, MoGA (Modular Global Attention), que es un nuevo mecanismo de atención diseñado específicamente para resolver los problemas de extensión del contexto y el costo computacional en la generación de videos largos. Gracias a la optimización de la estructura de MoGA, el modelo puede procesar información de contexto de hasta 580.000 tokens, reduciendo significativamente el costo computacional y permitiendo así la generación de videos de larga duración y múltiples escenas.

El equipo de investigación señaló que los modelos tradicionales de generación de videos suelen estar limitados por la memoria de video y la capacidad de cálculo, pudiendo generar solo animaciones GIF o cortos de unos segundos. La incorporación de MoGA permite al modelo "generar de una vez" mini cortos que incluyan cambios de escena múltiples y una narrativa visual coherente, ampliando enormemente los límites de aplicación de los modelos de video generativo.

Además, MoGA tiene una alta modularidad y compatibilidad, pudiendo integrarse directamente con bibliotecas de aceleración eficientes existentes (como FlashAttention, xFormers, DeepSpeed, etc.), logrando así una mayor velocidad de entrenamiento e inferencia. Esto significa que esta tecnología no solo tiene importancia en términos de avances científicos, sino que también tiene potencial para aplicaciones industriales, pudiendo utilizarse en creación cinematográfica, generación de publicidad, animaciones de transición en juegos y producción de contenido de personas digitales, entre otros campos.

A medida que empresas como OpenAI, Pika y Runway avanzan en la generación de videos cortos, el modelo presentado por la Universidad de Ciencia y Tecnología de China y ByteDance se considera el primer sistema en China capaz de generar realmente videos de largo alcance con una duración de minutos. Su ventaja en algoritmos, eficiencia y escalabilidad podría impulsar a China a colocarse entre los países líderes en el campo de la generación de videos.

Dirección: https://jiawn-creator.github.io/mixture-of-groups-attention/

Modelo de generación de videos largos de extremo a extremo ByteDance Universidad de Ciencia y Tecnología de China IA generativa

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

La société norvégienne de robots 1X lance son premier robot humanoïde destiné aux ménages, le Neo, au prix de 20 000 dollars, avec un abonnement mensuel de 499 dollars. Ce robot de 1,68 mètre est spécialement conçu pour des tâches ménagères comme laver la vaisselle ou ranger, et utilise un mode de collaboration entre l'IA et une assistance humaine à distance pour accomplir des tâches complexes.

Oct 29, 2025

130

Amazon Web Services prévoit un investissement supplémentaire de 5 milliards de dollars en Corée du Sud pour développer des centres de données axés sur l'intelligence artificielle

Amazon AWS a annoncé qu'il investirait 5 milliards de dollars supplémentaires en Corée du Sud au cours des six prochaines années pour agrandir ses centres de données axés sur l'intelligence artificielle, et collaborera avec le groupe SK pour construire un grand établissement à Ulsan. L'investissement total en Corée atteindra 12,6 milliards de dollars, ce qui souligne l'importance stratégique accordée au marché coréen.

Oct 29, 2025

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

La technologie IA connaît un développement rapide, le secteur du jeu vidéo est en pleine transformation. L'IA générative apporte de nouvelles opportunités et défis, Microsoft, Amazon et d'autres entreprises réorientent leurs ressources vers les applications de l'IA. Les développeurs de jeux ont des avis divergents sur ce sujet, et le futur de l'industrie reste incertain.

Oct 29, 2025

100

Journal de l'IA : Douyin lance un système de doublage automatique pour plusieurs personnes ; Adobe Firefly Image 5 se voit fortement amélioré ; Soul présente le modèle vocal SoulX-Podcast

Doubao lance un système IA de livres audio multi-voix automatisé, générant directement des dialogues à partir de textes avec 98% de précision, égalant les productions professionnelles. Une innovation majeure pour la création de contenu audio.....

Oct 29, 2025

100

Qualcomm entre dans le secteur des centres de données ! Présentation des puces AI200/AI250 visant NVIDIA, la valeur actions a bondi de 20 % en une seule journée

Qualcomm a lancé deux puces pour l'inférence AI en cloud, l'AI200 et l'AI250, qui seront commercialisées en 2026 et 2027. Cela marque une transition vers l'infrastructure complète d'IA, passant des puces pour terminaux à l'ensemble de l'infrastructure d'IA. Cette nouvelle a fait bondir les actions de plus de 20 % en une seule journée, soit la plus grande hausse depuis 2019. Contrairement à la stratégie globale de NVIDIA, Qualcomm se concentre sur le marché de l'inférence des grands modèles, mettant en avant son avantage en termes d'efficacité énergétique et de coût.

Oct 29, 2025

140

Magic Leap annonce un nouveau partenariat avec Google pour développer un prototype de lunettes AR de prochaine génération

Le 29 octobre, Magic Leap et Google ont annoncé un nouveau partenariat lors du Sommet des investissements dans l'avenir à Ryad, afin de développer ensemble un prototype de lunettes AR et d'avancer dans le domaine de la réalité augmentée. Ross Rosenburg, dirigeant de Magic Leap, a déclaré que l'entreprise passait du statut de pionnier en réalité augmentée à celui de partenaire d'écosystème, et qu'elle utiliserait son expertise en optique et affichage pour atteindre une nouvelle phase de son vision.

Oct 29, 2025

100

Tsinghua et Kuaishou lancent un nouveau modèle de diffusion SVG, l'efficacité d'entraînement augmente de 6200%

L'équipe de Tsinghua et Kuaishou Ke Ling a présenté le modèle SVG, qui remplace la VAE, résolvant ainsi le problème du mélange sémantique, l'efficacité d'entraînement a augmenté de 6200%, la vitesse de génération a augmenté de 3500%, marquant l'abandon progressif de la VAE dans le domaine de la génération d'images.

Oct 29, 2025

130

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Lors de la conférence GTC 2025, NVIDIA a présenté le « projet de conception Omniverse DSX », destiné spécifiquement aux centres de données AI de plusieurs milliards de watts. Ce projet est appelé l'« usine IA ». Cette solution repose sur le cadre Omniverse et prend en charge des configurations allant d'un à dix milliards de watts. Elle vise à former et à exécuter efficacement des modèles AI de grande taille, répondant ainsi à la croissance continue des besoins en calcul IA, représentant une avancée majeure dans les infrastructures d'intelligence artificielle.

Oct 29, 2025

200

Liu Li, vice-président de Douyin : La technologie d'IA aide à lutter contre la désinformation et à créer un environnement fiable sur la plateforme

L'Xinhua rapporte le problème des fausses nouvelles créées par l'intelligence artificielle. Liu Li, vice-président de Douyin, a répondu qu'une IA est un double tranchant : bien qu'elle puisse faciliter la désinformation, Douyin utilise l'intelligence artificielle pour lutter contre la désinformation, en développant des entités intelligentes qui recherchent rapidement les informations autorisées pour démentir les rumeurs.

Oct 29, 2025

Le vice-président de Douyin, Li Liang, affirme que l'IA rend la diffusion de fausses informations plus facile, et la plateforme utilise activement des agents intelligents pour lutter contre les rumeurs

Le vice-président de Douyin, Li Liang, a insisté sur le fait que l'IA peut facilement être utilisée pour créer des rumeurs, et la plateforme s'emploie activement à lutter contre les rumeurs grâce aux technologies d'IA, en développant un "agent de lutte contre les rumeurs", qui effectue une recherche rapide sur toute la toile, en tant que priorité cette année.

Oct 29, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

El Instituto de Ciencia y Tecnología de China y ByteDance presentan el modelo de generación de videos largos MoGA: generación de cortos con múltiples escenas en un solo clic en minutos

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

Amazon Web Services prévoit un investissement supplémentaire de 5 milliards de dollars en Corée du Sud pour développer des centres de données axés sur l'intelligence artificielle

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

Journal de l'IA : Douyin lance un système de doublage automatique pour plusieurs personnes ; Adobe Firefly Image 5 se voit fortement amélioré ; Soul présente le modèle vocal SoulX-Podcast

Qualcomm entre dans le secteur des centres de données ! Présentation des puces AI200/AI250 visant NVIDIA, la valeur actions a bondi de 20 % en une seule journée

Magic Leap annonce un nouveau partenariat avec Google pour développer un prototype de lunettes AR de prochaine génération

Tsinghua et Kuaishou lancent un nouveau modèle de diffusion SVG, l'efficacité d'entraînement augmente de 6200%

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Liu Li, vice-président de Douyin : La technologie d'IA aide à lutter contre la désinformation et à créer un environnement fiable sur la plateforme

Le vice-président de Douyin, Li Liang, affirme que l'IA rend la diffusion de fausses informations plus facile, et la plateforme utilise activement des agents intelligents pour lutter contre les rumeurs

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

Amazon Web Services prévoit un investissement supplémentaire de 5 milliards de dollars en Corée du Sud pour développer des centres de données axés sur l'intelligence artificielle

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

Journal de l'IA : Douyin lance un système de doublage automatique pour plusieurs personnes ; Adobe Firefly Image 5 se voit fortement amélioré ; Soul présente le modèle vocal SoulX-Podcast

Qualcomm entre dans le secteur des centres de données ! Présentation des puces AI200/AI250 visant NVIDIA, la valeur actions a bondi de 20 % en une seule journée

Magic Leap annonce un nouveau partenariat avec Google pour développer un prototype de lunettes AR de prochaine génération

Tsinghua et Kuaishou lancent un nouveau modèle de diffusion SVG, l'efficacité d'entraînement augmente de 6200%

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Liu Li, vice-président de Douyin : La technologie d'IA aide à lutter contre la désinformation et à créer un environnement fiable sur la plateforme

Le vice-président de Douyin, Li Liang, affirme que l'IA rend la diffusion de fausses informations plus facile, et la plateforme utilise activement des agents intelligents pour lutter contre les rumeurs

GEO Services