Boletín diario de IA: ¡Un nuevo rey ha nacido! Runway lanza Gen-3 Alpha; Luma AI lanza la función Extend; DeepSeek lanza otro modelo de código abierto; ElevenLabs permite la doblaje automático de videos

¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentaremos los temas más relevantes del ámbito de la IA, enfocados en desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de los productos de IA.

Productos de IA nuevos https://top.aibase.com/: Haga clic para obtener más información.

1. ¡El rey de los videos de IA ha regresado! El nuevo modelo Gen3 de Runway vuelve a sorprender a los usuarios

Este artículo presenta el nuevo modelo de generación de video Gen-3Alpha de Runway, que ha mejorado significativamente en fidelidad, coherencia y representación del movimiento, marcando un paso importante en la construcción de modelos mundiales generales. Gen-3Alpha cuenta con varias funciones y características notables, convirtiéndose en una estrella en la industria creativa.

【Resumen de AiBase:】
⭐️ Gen-3Alpha presenta una mejora notable en fidelidad, coherencia y representación del movimiento, capaz de generar personajes humanos realistas y expresivos.
⭐️ Gen-3Alpha admite varias herramientas de generación, como texto a video, imagen a video y texto a imagen.
⭐️ Permite un control temporal preciso y admite varios modos de control avanzados, incluyendo pincel de movimiento, control de cámara avanzado y modo director.
⭐️ Ofrece una iluminación extremadamente estable, manteniendo una salida de alta calidad incluso en escenas con movimiento rápido.
Más videos aquí: https://mp.weixin.qq.com/s/5LbM0NfkeiYFU0r4VDqpYA
Dirección del sitio web: https://top.aibase.com/tool/gen-3-alpha

2. Luma AI lanza la función Extend: extiende la duración de los videos a más de 10 segundos

Luma AI ha actualizado recientemente su modelo de video Dream Machine, añadiendo la función Extend, que permite extender la duración de los videos a más de 10 segundos manteniendo el estilo y los objetos del video original. Aunque la función Extend tarda más en generar videos extendidos, la coherencia del estilo se mantiene bien.

【Resumen de AiBase:】
✨ Dream Machine se actualiza con la función Extend, permitiendo videos de más de 10 segundos manteniendo el estilo y los objetos originales.
⏱️ Extender videos con la función Extend lleva más tiempo, pero la coherencia del estilo es buena.
🔗 Más detalles: https://www.chinaz.com/ainews/9639.shtml

3. DeepSeek lanza el modelo de código abierto DeepSeek-Coder-V2

DeepSeek ha lanzado recientemente el modelo de código abierto DeepSeek-Coder-V2, que supera a GPT-4-Turbo en capacidad de código y matemáticas, con un rendimiento líder a nivel mundial. El modelo utiliza la arquitectura MoE, admite múltiples idiomas y una mayor longitud de contexto. Los usuarios pueden utilizarlo comercialmente de forma gratuita, sin necesidad de solicitar permiso.

【Resumen de AiBase:】
🚀 Rendimiento líder a nivel mundial, especialmente en generación de código y aritmética matemática.
💡 Admite 338 lenguajes de programación y una longitud de contexto de 128K, satisfaciendo más necesidades de desarrollo.
🔗 Ofrece servicios de API, con precios iguales a DeepSeek-V2, mostrando un excelente rendimiento en las pruebas de referencia.
Enlace de detalles: https://top.aibase.com/tool/deepseek-coder-v2

4. Adobe Acrobat recibe una importante actualización de IA: admite el análisis de múltiples documentos y la generación de imágenes

Adobe lanzará próximamente una serie de importantes actualizaciones de IA para mejorar las funciones del asistente de IA de Acrobat, la capacidad de generación de imágenes y garantizar la protección de la privacidad de los datos. Esta actualización mejorará enormemente la eficiencia de la oficina, facilitando el procesamiento de grandes cantidades de documentos y la optimización del contenido visual.

QQ截图20240618092653.png

【Resumen de AiBase:】
🚀 El asistente de IA se actualiza, admitiendo el análisis y la consulta de múltiples documentos, mejorando la experiencia del usuario.
🖼️ Se añade un generador de imágenes de IA, permitiendo a los usuarios generar imágenes nuevas o editar las imágenes existentes en los PDF.
🔒 Compromiso con la protección de la privacidad de los datos: los documentos se suben a la nube para su análisis, pero no se utilizan para entrenar modelos de IA y se prohíbe su uso por parte de terceros.

5. Apple publica 20 modelos Core ML en la plataforma Hugging Face

Apple ha publicado en la plataforma Hugging Face 20 nuevos modelos Core ML y 4 conjuntos de datos, mostrando sus importantes avances en el impulso del desarrollo de la IA. Esta actualización incluye nuevos modelos emocionantes centrados en texto e imágenes, y abarca una amplia gama de aplicaciones, como la clasificación de imágenes, la estimación de profundidad monocular y la segmentación semántica. Apple destaca la importancia de la IA en los dispositivos, mejorando el rendimiento de las aplicaciones ejecutando modelos optimizados en los dispositivos de los usuarios, garantizando al mismo tiempo la seguridad y la privacidad de los datos de los usuarios.

【Resumen de AiBase:】
🚀 Apple publica 20 nuevos modelos Core ML y 4 conjuntos de datos en la plataforma Hugging Face, impulsando el desarrollo de la IA.
💡 Los nuevos modelos Core ML abarcan una amplia gama de aplicaciones, incluyendo la clasificación de imágenes, la estimación de profundidad monocular y la segmentación semántica.
🔒 Apple destaca la importancia de la IA en los dispositivos: los modelos optimizados se ejecutan en los dispositivos de los usuarios, mejorando el rendimiento de las aplicaciones y garantizando la seguridad y la privacidad de los datos de los usuarios.
Enlace de detalles: https://huggingface.co/apple

6. ElevenLabs lanza una herramienta de efectos de sonido de generación de video de código abierto: sube un video y obtén doblaje automático

ElevenLabs, una empresa especializada en tecnología de generación de audio, ha anunciado recientemente su incursión en el campo de la generación de video, lanzando un proyecto de código abierto que permite doblar automáticamente los videos subidos, generando efectos de sonido adecuados. Han lanzado una nueva función que permite a los usuarios generar diversos efectos de sonido realistas mediante la introducción de texto, lo que supone una gran ayuda para las industrias del cine, los videojuegos y los videos cortos. Además de la generación de efectos de sonido, también ofrece funciones potentes como la clonación de voz y la conversión de texto a voz.

【Resumen de AiBase:】
🔊 Doblaje automático de videos subidos, generando efectos de sonido adecuados.
🎶 Genera diversos efectos de sonido realistas mediante la introducción de texto, ayudando a las industrias del cine, los videojuegos y los videos cortos.
🎤 Ofrece funciones de clonación de voz y conversión de texto a voz, dando a los contenidos formas de expresión más vívidas.
Entrada de conversión de texto a audio: https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi
Entrada de doblaje automático de video: https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api

7. Tencent WeChat Video Number planea restringir la venta de productos por parte de avatares digitales

Tencent Video Number ha anunciado recientemente una revisión de las «Medidas para la publicación de contenido de baja calidad por parte de influencers en Video Number», con el objetivo de reforzar la supervisión de la calidad del contenido y planea prohibir la venta de productos a través de transmisiones en vivo con avatares digitales. Esta revisión se sometió a consulta pública del 7 al 13 de junio de este año.

【Resumen de AiBase:】
⭐ La revisión de las medidas tiene como objetivo reforzar la supervisión de la calidad del contenido de Video Number.
⭐ Se prohíbe la venta de productos a través de transmisiones en vivo con avatares digitales, prohibiendo explícitamente el contenido de transmisiones en vivo no reales.
⭐ La plataforma tomará medidas disciplinarias contra los infractores.
Más detalles: https://www.chinaz.com/2024/0618/1624007.shtml

8. SD3 de Stability AI enfrenta oposición por problemas de licencia, la comunidad CivitAI bloquea el contenido relacionado

El último modelo importante de Stability AI, SD3, ha generado controversia por problemas de licencia y se enfrenta a la oposición de la comunidad de IA. La comunidad CivitAI ha bloqueado el contenido relacionado con SD3, lo que ha provocado una disputa sobre los acuerdos de licencia. La empresa ha lanzado una licencia de creador orientada al consumidor, que limita las condiciones de los desarrolladores y la cantidad de imágenes generadas. SD3 tiene problemas para generar ciertas posturas corporales, y su futuro es incierto. La salida del CEO y los despidos obligan a la empresa a explicar el impacto de su nuevo acuerdo de licencia. Toda esta controversia tiene un impacto potencial en la comunidad de IA y el desarrollo de modelos de código abierto.

【Resumen de AiBase:】
💥 SD3 genera controversia por problemas de licencia y enfrenta la oposición de la comunidad de IA.
🔒 La empresa lanza una licencia de creador, limitando las condiciones de los desarrolladores y la cantidad de imágenes generadas.
❓ SD3 tiene problemas para generar ciertas posturas corporales, y su futuro es incierto.

9. Impresora Lego Pixelbot 3000

Este artículo presenta la impresora Lego Pixelbot 3000 diseñada y fabricada por el creador del canal de YouTube @Creative Mindstorms, que utiliza código personalizado e inteligencia artificial para generar mosaicos Lego. El usuario solo necesita introducir el nombre de la obra de arte, la IA genera la imagen y Pixelbot 3000 ensambla automáticamente el mosaico.

【Resumen de AiBase:】
🤖 Utilizando código personalizado e inteligencia artificial, Pixelbot 3000 puede generar automáticamente mosaicos Lego, simplificando el proceso de impresión.
🎨 Pixelbot 3000 utiliza DALL-E3 de OpenAI para generar imágenes simplificadas en estilo de dibujos animados, generando finalmente imágenes escaladas de alto contraste.
🔧 Pixelbot 3000 divide la imagen generada por la IA y muestrea el color del píxel central de cada cuadro para obtener un mejor patrón de mosaico.

10. Los investigadores enseñan a la IA a reconocer bocetos de líneas humanas

Este artículo presenta un nuevo método desarrollado por un equipo de investigación de la Universidad de Surrey y la Universidad de Stanford que enseña a la inteligencia artificial a comprender la importancia y los resultados de los bocetos de líneas humanas. Al combinar bocetos y descripciones de texto, la inteligencia artificial muestra una capacidad de comprensión cercana a la humana, identificando y etiquetando con precisión objetos en escenas complejas. Esta investigación abre nuevas posibilidades para la interacción humano-computadora y los flujos de trabajo de diseño.

【Resumen de AiBase:】
🧠 La inteligencia artificial aprende a comprender la importancia de los bocetos, mostrando un rendimiento cercano al humano.
🌳 La inteligencia artificial puede identificar y etiquetar objetos como cometas, árboles y jirafas con un 85% de precisión, superando a otros modelos.
🎨 El nuevo método no solo es aplicable a bocetos realizados por no artistas, sino también a bocetos de objetos sin entrenamiento específico.
Enlace de detalles: https://arxiv.org/abs/2312.12463

11. Estudio: las imágenes generadas por IA no representan con precisión las sutiles diferencias culturales de la arquitectura islámica

La inteligencia artificial (IA) está revolucionando el campo del diseño arquitectónico, pero en áreas culturalmente sensibles como la arquitectura islámica, las imágenes generadas por IA no representan correctamente los elementos históricos. El estudio señala que los generadores de IA carecen de conocimiento histórico y recomienda un uso cauteloso. Los autores consideran que la IA puede ser una herramienta valiosa, pero debe combinarse con el conocimiento profesional humano y la sensibilidad cultural.

【Resumen de AiBase:】
🏗️ La IA está revolucionando el diseño arquitectónico, pero presenta desafíos en el ámbito de la arquitectura islámica.
🕌 Los generadores de IA carecen de conocimiento histórico y no representan con precisión los detalles culturales de la arquitectura islámica.
🤖 La IA debe utilizarse como una herramienta para potenciar la creatividad humana, combinándola con conocimientos profesionales y sensibilidad cultural.

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

Boletín diario de IA: ¡Un nuevo rey ha nacido! Runway lanza Gen-3 Alpha; Luma AI lanza la función Extend; DeepSeek lanza otro modelo de código abierto; ElevenLabs permite la doblaje automático de videos

站长之家

Este artículo proviene de AIbase Daily