MarDini

Modelo de difusión autorregresivo para la generación de video a gran escala

Producto ComúnVideoGeneración de videoAutorregresivo

MarDini es un modelo de difusión de video desarrollado por Meta AI Research que integra las ventajas del autorregresivo enmascarado (MAR) en un marco de modelo de difusión unificado (DM). Este modelo puede generar video a partir de un número arbitrario de fotogramas enmascarados en cualquier posición de fotograma, admitiendo diversas tareas de generación de video como interpolación de video, generación de video a partir de imágenes y extensión de video. El diseño eficiente de MarDini asigna la mayoría de los recursos computacionales a un modelo de planificación de baja resolución, lo que permite la atención espacio-temporal a gran escala. MarDini establece un nuevo estándar en la interpolación de video y genera videos comparables a los modelos de imagen a video de nivel superior más costosos en pocas etapas de inferencia.

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

MarDini

MarDini Situación del tráfico más reciente

MarDini Tendencia de visitas

MarDini Distribución geográfica de las visitas

MarDini Fuentes de tráfico

MarDini Alternativas

MarDini — Modelo de difusión autorregresivo para la generación de video a gran escala

AccVideo — Modelo de difusión de video acelerado, velocidad de generación aumentada en 8.5 veces.

Sora para Dispositivos Móviles — Sora para Dispositivos Móviles es un proyecto de generación de vídeo a partir de texto en dispositivos móviles basado en un modelo de difusión.

Difusión como Shader — Un modelo de arquitectura unificada que admite diversas tareas de control de generación de video.

ComfyUI_HelloMeme — Herramienta de generación de imágenes y vídeo basada en modelos de difusión.

Fashion-VDM — Modelo de difusión de video para probadores virtuales.

FasterCache — Herramienta de aceleración de modelos de difusión de video que genera contenido de video de alta calidad sin necesidad de entrenamiento.

genmoai — Modelo de generación de video de código abierto

HelloMeme — Integra la atención espacial entretejida para mejorar la fidelidad condicional de los modelos de difusión.

UniAnimate — Modelo para la generación eficiente de animaciones de video de personajes con alta consistencia.

MuseV — Modelo de generación de video, admite la generación de videos de personas virtuales de alta fidelidad y longitud ilimitada.

Sora — Modelo de difusión de generación de video a gran escala

Show-1 — Show-1 combina modelos de difusión de píxeles y latentes para generar vídeo a partir de texto de forma eficiente y de alta calidad.

Veo3 — Cree increíbles videos de IA con Veo 3 y sincronice automáticamente el audio.

Veo 3 — Modelo avanzado de generación de vídeos con mayor realismo y creatividad.

Flow IA — Una herramienta de creación cinematográfica basada en IA que impulsa la creación.

PixVerse-MCP — Accede a los modelos de generación de video más recientes de PixVerse a través del protocolo MCP.

AvatarFX — Una plataforma de IA para la narración interactiva de historias que genera vídeos a partir de imágenes y audio.

SkyReels-V2 — El primer modelo de generación de películas de duración ilimitada del mundo, que inaugura una nueva era en la generación de video

Wan2.1-FLF2V-14B — Modelo de generación de video de código abierto, compatible con múltiples tareas de generación.

FramePack — Modelo de predicción del siguiente fotograma utilizado para la generación de video.

Pusa — Pusa es un novedoso modelo de difusión de video que admite varias tareas de generación de video.

Dream 7B — Dream 7B es uno de los modelos lingüísticos grandes de difusión abierta más potentes.

SkyReels-A2 — Un marco para sintetizar cualquier contenido en un transformador de difusión de vídeo.

DreamActor-M1 — Marco de animación de imágenes humanas basado en DiT, que permite un control preciso y una coherencia a largo plazo.

GAIA-2 — GAIA-2 es un modelo avanzado de generación de video para crear escenarios de conducción autónoma seguros.

Video-T1 — Mejora significativamente la calidad de generación de video mediante la escala de tiempo de prueba.

Optimización de Contexto Largo (OCL) — Una tecnología que mejora la capacidad de generación de videos a nivel de escena.

MM_StoryAgent — MM_StoryAgent es un framework multiagente para generar videos de historias inmersivas.