¡Fiesta para los usuarios gratuitos! Veo2 llega a Google AI Studio: videos hiperrealistas de hasta 8 segundos

AIbase基地

Publicado elNoticias de IA · 10 minutos de lectura · Apr 16, 2025

El nuevo modelo de generación de video de Google DeepMind, Veo2, ha llegado oficialmente a Google AI Studio y la API de Gemini, marcando un nuevo hito en la tecnología de generación de video con IA. Como producto estrella de Google para competir con OpenAI Sora, Veo2 se ha convertido rápidamente en el centro de atención de la industria gracias a su excepcional realismo visual, capacidad de simulación física y respuesta precisa a instrucciones complejas.

Veo2: Un avance en la generación de video de alta fidelidad

Veo2 es la última creación de Google DeepMind en el campo de la generación de video. Admite la generación de clips de video de hasta 720p de resolución, 24 fps y una duración máxima de 8 segundos a partir de indicaciones de texto o imágenes. En el futuro, se espera que se amplíe a una resolución de 4K y una duración mayor.

En comparación con los modelos anteriores, Veo2 ha logrado un avance significativo en detalles visuales, fluidez del movimiento y realismo físico. El modelo puede simular con precisión las leyes físicas del mundo real, como el flujo de líquidos, las colisiones de objetos y los movimientos naturales de las personas, reduciendo los problemas de "alucinaciones" comunes en los videos generados por IA, como dedos adicionales u objetos antinaturales.

La ventaja única de Veo2 radica en su profunda comprensión del lenguaje cinematográfico. Los usuarios pueden especificar el tipo de lente (como un gran angular de 18 mm), el ángulo de cámara (como una toma de seguimiento de ángulo bajo) o efectos especiales (como poca profundidad de campo) a través de las indicaciones, generando videos con una calidad cinematográfica profesional. Por ejemplo, la indicación "Abejas rodeando a un apicultor bajo la luz del sol, lente de 35 mm, luz dorada" puede generar una escena dinámica realista y detallada, donde el movimiento natural del enjambre de abejas se coordina con los movimientos del apicultor. Esta respuesta precisa a instrucciones complejas permite que Veo2 destaque en las pruebas comparativas con otros modelos líderes, especialmente en el conjunto de datos MovieGenBench evaluado por humanos.

Google AI Studio: Una nueva plataforma creativa para desarrolladores y creadores

Veo2 ya está integrado en Google AI Studio, proporcionando a los desarrolladores una plataforma de experimentación intuitiva. Los usuarios pueden probar indicaciones, ajustar parámetros (como resolución, duración y relación de aspecto) y obtener una vista previa en tiempo real de los resultados generados. Para los desarrolladores que deseen integrar Veo2 en sus propias aplicaciones, la API de Gemini ofrece soporte de nivel de pago, con un precio de 0,35 dólares por segundo de video. Este acceso flexible reduce las barreras tecnológicas, permitiendo que creadores individuales, pequeñas y medianas empresas y grandes estudios puedan empezar a trabajar rápidamente.

Además, Veo2 admite dos modos de generación: texto a video (T2V) e imagen a video (I2V). Los desarrolladores pueden generar escenas completamente nuevas a través de descripciones de texto detalladas, o utilizar imágenes como referencia y combinarlas con indicaciones de texto para generar contenido dinámico que se ajuste a un estilo específico. Por ejemplo, la empresa de desarrollo de juegos Wolf Games utiliza Veo2 para crear juegos de historias interactivas personalizados, mejorando significativamente el realismo visual y la eficiencia de producción, reduciendo en más del 60% el número de iteraciones visuales.

Seguridad y responsabilidad: Guardianes del contenido generado por IA

Google ha adoptado principios de IA responsables en el desarrollo de Veo2. Todos los videos generados incorporan una marca de agua digital SynthID para identificar el contenido generado por IA y reducir el riesgo de desinformación. Además, el modelo incluye filtros de seguridad y mecanismos de verificación de contenido para garantizar que el contenido generado cumpla con las normas de privacidad, derechos de autor y ética. Google afirma que su estrategia de lanzamiento gradual de Veo2 tiene como objetivo optimizar continuamente la calidad y la seguridad del modelo, sentando las bases para aplicaciones más amplias en el futuro.

El lanzamiento de Veo2 ha traído oportunidades transformadoras para varios sectores. En el campo de la creación de contenido, YouTube Shorts integró Veo2 en febrero de 2025, permitiendo a los creadores generar escenas únicas a través de indicaciones de texto para enriquecer la narrativa de videos cortos. En el ámbito del marketing, las empresas pueden generar rápidamente videos promocionales de alta calidad para mejorar el atractivo de su marca. En la educación y el desarrollo de juegos, la capacidad de generación de escenas dinámicas de Veo2 proporciona nuevas herramientas para el aprendizaje interactivo y las experiencias inmersivas. Los análisis de mercado indican que se espera que el mercado mundial de generación de video con IA supere los 5000 millones de dólares en 2025, y la popularización de Veo2 acelerará aún más esta tendencia.

AIBase considera que el lanzamiento de Veo2 en Google AI Studio no solo representa un avance tecnológico, sino también una muestra de la estrategia de Google en el ámbito de las herramientas creativas de IA. Su capacidad de generación de alta fidelidad, su interpretación precisa del lenguaje cinematográfico y su soporte flexible para desarrolladores otorgan a los creadores una libertad de expresión sin precedentes. En el futuro, Google planea expandir Veo2 a más plataformas, como YouTube y Vertex AI, y mejorar la duración y la resolución del video, consolidando aún más su posición de liderazgo en el campo de la generación de video con IA.

Fuentes: Sitio web oficial de Google DeepMind, anuncio de Google AI Studio, blog de Google Developers e informes de la industria relacionados.

Google presenta una herramienta de integración de datos de mapas Gemini: el AI puede acceder directamente a información en tiempo real de 250 millones de lugares

Google presenta una nueva herramienta de Gemini API denominada Grounding with Google Maps, que integra profundamente la inteligencia artificial con los datos de mapas. Esta función puede acceder a información de más de 250 millones de lugares, incluyendo direcciones y horarios de apertura, para generar respuestas espaciales geográficas basadas en datos reales. Cuando los usuarios consultan preguntas relacionadas con ubicaciones, Gemini puede acceder automáticamente a los datos en tiempo real de los mapas para responder.

Google Gemini API presenta la función de geolocalización en mapas, las aplicaciones de IA se convierten de repente en expertos locales

Google lanza una nueva función para Gemini API llamada geolocalización en mapas, permitiendo a los desarrolladores integrar directamente sus aplicaciones de IA en los datos de más de 250 millones de ubicaciones de Google Maps. Esta función admite la identificación automática de consultas de ubicación geográfica, extrayendo información estructurada en tiempo real como direcciones y horas de atención, lo que mejora significativamente la eficiencia en el desarrollo de aplicaciones de IA con conciencia de ubicación.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

¡Fiesta para los usuarios gratuitos! Veo2 llega a Google AI Studio: videos hiperrealistas de hasta 8 segundos

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Google presenta una herramienta de integración de datos de mapas Gemini: el AI puede acceder directamente a información en tiempo real de 250 millones de lugares

Google Gemini API presenta la función de geolocalización en mapas, las aplicaciones de IA se convierten de repente en expertos locales

El modelo de inteligencia artificial C2S-Scale 27B para vías de tratamiento del cáncer desarrollado por Google DeepMind y la Universidad de Yale

Gemini 3.0 Pro de Google comienza a distribuirse en pequeña escala: mejora las capacidades de razonamiento, su lanzamiento oficial podría ser a finales de este mes

El desarrollador principal de Google DeepMind se une a xAI para apoyar el desarrollo de Grok

Google DeepMind lanza VaultGemma con capacidad de privacidad diferencial

Google lanza una nueva función de contexto de URL en la API Gemini que puede detallar el contenido de las páginas web

El modelo de inteligencia artificial de Google predijo con éxito la intensidad y la trayectoria de la tormenta atlántica más fuerte de este año

Google lanza un nuevo modelo de edición de imágenes Gemini 2.5 Flash, edición precisa y fácil para editar fotos

Gran actualización de la API de Google Gemini: un solo fragmento de código para capturar páginas web, aumento significativo en la eficiencia del desarrollo

Noticias de IA relacionadas recomendadas

Google presenta una herramienta de integración de datos de mapas Gemini: el AI puede acceder directamente a información en tiempo real de 250 millones de lugares

Google Gemini API presenta la función de geolocalización en mapas, las aplicaciones de IA se convierten de repente en expertos locales

El modelo de inteligencia artificial C2S-Scale 27B para vías de tratamiento del cáncer desarrollado por Google DeepMind y la Universidad de Yale

Gemini 3.0 Pro de Google comienza a distribuirse en pequeña escala: mejora las capacidades de razonamiento, su lanzamiento oficial podría ser a finales de este mes

El desarrollador principal de Google DeepMind se une a xAI para apoyar el desarrollo de Grok

Google DeepMind lanza VaultGemma con capacidad de privacidad diferencial

Google lanza una nueva función de contexto de URL en la API Gemini que puede detallar el contenido de las páginas web

El modelo de inteligencia artificial de Google predijo con éxito la intensidad y la trayectoria de la tormenta atlántica más fuerte de este año

Google lanza un nuevo modelo de edición de imágenes Gemini 2.5 Flash, edición precisa y fácil para editar fotos

Gran actualización de la API de Google Gemini: un solo fragmento de código para capturar páginas web, aumento significativo en la eficiencia del desarrollo