En el campo de la generación de videos impulsada por inteligencia artificial recientemente, la empresa ByteDance (la matriz de TikTok) ha lanzado de manera discreta un nuevo modelo llamado Seedance1.0, que ya ha superado a Veo3, la última creación de Google, en evaluaciones independientes. Aunque Veo3 ha capturado la atención con su síntesis de audio y herramientas de calidad cinematográfica, el poder técnico de Seedance1.0 ha dejado una impresión notable, convirtiéndose en el líder en la generación de videos.

El documento de investigación de Seedance1.0 detalla las innovaciones del modelo. El equipo de ByteDance logró descouplar capas espaciales y temporales, combinándolo con codificación posicional multimodal, lo que permitió al modelo manejar simultáneamente tareas de generación de video desde texto a video e imagen a video. Este enfoque facilita transiciones de escenarios complejos y narrativas de múltiples tomas, manteniendo una coherencia temática consistente.

image.png

Además, el rendimiento de Seedance1.0 se debe en gran parte a los potentes pipelines de datos de ByteDance. El equipo construyó cuidadosamente un conjunto de datos masivo y de múltiples fuentes, equipado con anotaciones bilingües detalladas y abundantes características de acción y estática, asegurando la precisión del contenido generado. Además, adoptaron un novedoso entorno de aprendizaje por refuerzo que combina tres modelos de recompensa, centrándose en la alineación básica, la calidad de la acción y la estética.

image.png

En las pruebas, Seedance1.0 superó a Veo3 en varios aspectos. En el SeedVideoBench, un conjunto de pruebas desarrollado en colaboración con directores de cine, el modelo obtuvo mejores puntuaciones en la adherencia a las indicaciones y la autenticidad de las acciones. En la tarea de imagen a video, Seedance mantuvo la consistencia visual de los fotogramas de entrada, mientras que Veo3 mostró cambios en la iluminación y texturas en ciertos casos.

image.png

En términos de rendimiento de inferencia, Seedance1.0 también destacó. El modelo puede generar un video de 1080p de cinco segundos en 41,4 segundos, una velocidad significativamente superior a la de otros competidores como Sora, Runway Gen-4 y Veo3. ByteDance también mencionó avances importantes en la reducción de costos y latencias, acercándose al objetivo de aplicaciones en tiempo real.

Se planea integrar Seedance1.0 a plataformas como DouBao y JiMeng en junio de 2025, con el objetivo de mejorar sustancialmente los flujos de trabajo profesionales y las tareas creativas habituales. Aunque Veo3 ha captado atención por combinar videos reales con efectos de sonido ambiental y diálogos por primera vez, Seedance1.0 sobresale en fidelidad visual, estabilidad de movimiento y coherencia narrativa, aunque carece de algunas capacidades auditivas.

Resaltar:

🌟 El lanzamiento de Seedance1.0 ha superado a Google Veo3, estableciendo un nuevo estándar en la tecnología de generación de videos.  

⚙️ Este modelo logra transiciones de escenarios complejos y narrativas de múltiples tomas mediante la codificación posicional multimodal.  

⚡ Seedance1.0 destaca en velocidad de generación y consistencia visual, y se espera que sea una herramienta clave para la creación profesional en 2025.