El modelo de generación de video con IA Vidu de Shengshu Science & Technology se lanza globalmente, convirtiendo imágenes/texto en video

AIbase基地

Publicado elNoticias de IA · 3 minutos de lectura · Jul 30, 2024

2.3k

Hoy, Shengshu Technology de Beijing anuncia el lanzamiento global de Vidu, su modelo de generación de video con IA. Vidu es un modelo que utiliza la inteligencia artificial para generar videos a partir de texto o imágenes.

微信截图_20240730115537.png

En abril de este año, Shengshu Technology y la Universidad Tsinghua lanzaron conjuntamente "Vidu", el primer gran modelo de video de China, marcando un paso importante para China en la tecnología de generación de video.

"Vidu" utiliza la arquitectura U-ViT, de creación propia del equipo, que integra las tecnologías Diffusion y Transformer. Este innovador gran modelo de video puede generar rápidamente videos de alta definición de 1080P con una duración de hasta 16 segundos, mostrando una gran imaginación y creatividad mientras simula el mundo físico real. Su capacidad de generación de múltiples tomas y su consistencia espacio-temporal son características notables de "Vidu".

Desde su lanzamiento, "Vidu" ha logrado avances significativos a nivel mundial, alcanzando un nivel de rendimiento internacionalmente superior y continúa iterándose y optimizándose. Este logro se debe a la profunda acumulación del equipo en el aprendizaje automático bayesiano y en los grandes modelos multimodales, así como a varios resultados originales.

Gracias a su profundo conocimiento de la arquitectura U-ViT y a su amplia experiencia en ingeniería y datos, el equipo superó rápidamente los desafíos tecnológicos clave en la representación y el procesamiento de videos largos, desarrollando con éxito el gran modelo de video "Vidu". "Vidu" ha logrado resultados notables en la mejora de la coherencia y el dinamismo de los videos, impulsando el desarrollo de la tecnología de procesamiento de video.

Enlace de prueba: https://www.vidu.studio/

Modelo de generación de video con IA Vidu Shengshu Science & Technology Arquitectura U-ViT

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

Revolución de los grandes modelos ¡Cómo Gemini 2.5 Pro está revolucionando la forma en que procesamos la información

Jul 1, 2025

Diario de IA: Alibaba Tongyi lanza el modelo Qwen-TTS; Cursor ya admite la versión web y móvil; ByteDance presenta una tecnología de síntesis de imágenes XVerse

¡Bienvenido al programa 【Diario de IA】! Aquí es tu guía diaria para explorar el mundo de la inteligencia artificial. Cada día te presentamos los temas más destacados del campo de la IA, enfocándonos en desarrolladores, para que puedas comprender las tendencias tecnológicas y conocer aplicaciones innovadoras de productos de IA. Descubre nuevos productos de IA: https://top.aibase.com/1, Lanzamiento importante de Qwen-TTS: Nuevos avances en la síntesis de voz regional, con un realismo comparable al de una persona real. El modelo Qwen-TTS desarrollado por el equipo Tongyi de Alibaba ha logrado un gran avance en el campo de la síntesis de voz.

Jul 1, 2025

PerMAXity: Análisis de inversión impulsado por IA, informes financieros integrales generados automáticamente

Recientemente, Perplexity lanzó una nueva función llamada PerMAXity, que permite crear laboratorios mediante tareas programadas, permitiendo a los usuarios obtener informes financieros integrales de sus carteras de inversión sin la necesidad de analistas humanos. Esta innovadora función ha generado gran atención debido a su eficiencia y inteligencia. PerMAXity: Nueva referencia en el análisis financiero automático. PerMAXity es una función revolucionaria lanzada por Perplexity, que permite a los usuarios generar informes financieros detallados para cada activo en su cartera a través de tareas programadas previamente diseñadas. Independientemente de...

Jul 1, 2025

Meta crea un nuevo laboratorio de inteligencia superiores para liderar una nueva era de inteligencia artificial

La empresa Meta está realizando una reorganización interna importante, decidiendo integrar todos los equipos relacionados con la inteligencia artificial en una nueva unidad denominada "Laboratorio de Inteligencia Superiores de Meta". Esta noticia fue revelada por Bloomberg, según un memorando interno de Meta, el CEO de Meta, Mark Zuckerberg, busca concentrar la atención de la empresa en el desarrollo de inteligencia artificial de "superioridad" a través de esta reorganización.

Jul 1, 2025

NoteGen aparece de repente: una herramienta revolucionaria de notas impulsada por IA para múltiples plataformas. La gestión del conocimiento entra en una nueva era

En la era digital, las herramientas eficientes para tomar notas se han convertido en una parte fundamental de la gestión del conocimiento. Recientemente, un software de notas impulsado por IA llamado NoteGen ha ganado popularidad rápidamente. Soporta cinco plataformas: Windows, MacOS, Linux, iOS y Android, y ofrece una función gratuita de sincronización de datos entre múltiples dispositivos. Con el formato nativo de Markdown y una capacidad poderosa para integrar modelos de gran tamaño de terceros, redefine la experiencia de las notas. Soporte en todas las plataformas, sincronización gratuita sin interrupciones. NoteGen destaca por su excelente compatibilidad multiplataforma.

Jul 1, 2025

La cuarta edición del 'Tecnofest para Jóvenes Fuertes' de Taotian Group se lanzó con fuerza: el modelo de lenguaje de recomendación de cien mil millones de parámetros RecGPT está oficialmente en línea

El grupo Taotian anunció ayer durante su evento 'Tecnofest para Jóvenes Fuertes 4.0' que su modelo de recomendación de cien mil millones de parámetros RecGPT, desarrollado de forma independiente, ya está oficialmente en línea. Este logro innovador actualizará completamente la sección de 'Te Puede Gustar' en la página principal de Taobao móvil, mediante la tecnología AIGR (recomendación generativa), brindando a los usuarios una experiencia de recomendación más precisa y personalizada. El lanzamiento de RecGPT marca un importante paso adelante para Taobao en el campo de las recomendaciones en comercio electrónico. Los datos de prueba muestran que el flujo de información de recomendación equipado con el modelo RecGPT ha demostrado un excelente rendimiento, con un incremento real en la cantidad de clics de los usuarios.

Jul 1, 2025

TEN VAD sorprende con el código abierto: ¡Una herramienta poderosa para la detección de voz empresarial! Crea un asistente de voz inteligente avanzado

Jul 1, 2025

Chai-2 presenta un lanzamiento impactante: diseño de anticuerpos con cero ejemplos impulsado por IA, acelerando el desarrollo de medicamentos cien veces más rápido

La inteligencia artificial vuelve a sorprender en el campo del desarrollo de medicamentos. Chai Discovery ha presentado recientemente un nuevo modelo de IA llamado Chai-2, que ha generado gran interés gracias a sus tecnologías revolucionarias en el diseño molecular. Chai-2 logra el diseño de anticuerpos con cero ejemplos, con una tasa de éxito del 16%-20%, lo que supone un aumento de más de cien veces frente a los métodos tradicionales, reduciendo el ciclo de desarrollo de medicamentos de meses e incluso años a solo dos semanas. El diseño de anticuerpos con cero ejemplos rompe los obstáculos tradicionales. Chai-2 es un modelo de IA generativo multimodal desarrollado por Chai Discovery, especializado en...

Jul 1, 2025

El proyecto open source TEN VAD y Detection de turno de TEN Agent impulsa la inteligencia artificial de voz con un retardo extremadamente bajo

El equipo de TEN Agent anunció recientemente que su modelo principal **TEN Voice Activity Detection (VAD)** y **TEN Turn Detection** están ahora disponibles de código abierto, brindando una sólida base técnica para construir agentes de inteligencia artificial de voz en tiempo real y multimedios. Esta iniciativa marca un importante avance en la democratización y cooperación abierta de la tecnología de interacción de voz dentro del marco TEN. A continuación, se presentan las últimas noticias recopiladas por AIbase, que analizan en profundidad estos dos modelos principales.

Jul 1, 2025

Qwen-TTS presenta un gran lanzamiento: nuevo avance en síntesis de voz regional, con una realismo comparable al de un ser humano

Jul 1, 2025

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

El modelo de generación de video con IA Vidu de Shengshu Science & Technology se lanza globalmente, convirtiendo imágenes/texto en video

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Revolución de los grandes modelos ¡Cómo Gemini 2.5 Pro está revolucionando la forma en que procesamos la información

Diario de IA: Alibaba Tongyi lanza el modelo Qwen-TTS; Cursor ya admite la versión web y móvil; ByteDance presenta una tecnología de síntesis de imágenes XVerse

PerMAXity: Análisis de inversión impulsado por IA, informes financieros integrales generados automáticamente

Meta crea un nuevo laboratorio de inteligencia superiores para liderar una nueva era de inteligencia artificial

NoteGen aparece de repente: una herramienta revolucionaria de notas impulsada por IA para múltiples plataformas. La gestión del conocimiento entra en una nueva era

La cuarta edición del 'Tecnofest para Jóvenes Fuertes' de Taotian Group se lanzó con fuerza: el modelo de lenguaje de recomendación de cien mil millones de parámetros RecGPT está oficialmente en línea

TEN VAD sorprende con el código abierto: ¡Una herramienta poderosa para la detección de voz empresarial! Crea un asistente de voz inteligente avanzado

Chai-2 presenta un lanzamiento impactante: diseño de anticuerpos con cero ejemplos impulsado por IA, acelerando el desarrollo de medicamentos cien veces más rápido

El proyecto open source TEN VAD y Detection de turno de TEN Agent impulsa la inteligencia artificial de voz con un retardo extremadamente bajo

Qwen-TTS presenta un gran lanzamiento: nuevo avance en síntesis de voz regional, con una realismo comparable al de un ser humano