Boletín diario de IA: Kunlun Wanwei lanza el modelo de razonamiento multimodal R1V de código abierto; Doubao AI lanza tres funciones de programación; NVIDIA presenta la supercomputadora de IA personal DGX

¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentaremos los temas más relevantes del campo de la IA, enfocados en desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Conozca los nuevos productos de IA https://top.aibase.com/

1. Kunlun Wanwei lanza el modelo de razonamiento de cadena de pensamiento visual Skywork R1V de código abierto

Kunlun Wanwei ha lanzado Skywork R1V, el primer modelo de razonamiento multimodal de código abierto a nivel mundial, con 3.800 millones de parámetros y un rendimiento cercano al conocido modelo de código cerrado DeepSeek-R1. R1V destaca en tareas de preguntas y respuestas visuales y razonamiento complejo, obteniendo puntuaciones altas de 69 y 67,5 en las pruebas de referencia MMMU y MathVista respectivamente.

【Resumen de AiBase:】
🌟 Se lanza oficialmente Skywork R1V, el primer modelo de razonamiento multimodal de código abierto del sector a nivel mundial, con 3.800 millones de parámetros.
🚀 R1V muestra un rendimiento excelente en varias pruebas de referencia, especialmente en MMMU y MathVista, donde obtuvo puntuaciones de 69 y 67,5 respectivamente.
📚 La iniciativa de código abierto de Kunlun Wanwei tiene como objetivo fomentar el intercambio de tecnología, aportar dinamismo a la comunidad global de código abierto de IA y contribuir a la realización del sueño de la AGI.
Enlace de detalles: https://huggingface.co/Skywork/Skywork-R1V-38B

2. La capacidad de programación de Doubao AI se actualiza con tres nuevas funciones, incluyendo la vista previa de HTML

Doubao ha realizado recientemente una importante actualización de sus funciones de programación de IA para la versión web y de escritorio, con el objetivo de mejorar la eficiencia y la experiencia del usuario. Esta actualización incluye la vista previa en tiempo real de HTML, la ejecución directa de código Python y la generación de código de proyecto completo. Los usuarios pueden desarrollar páginas web y minijuegos de forma más intuitiva, corregir errores de código Python rápidamente y generar fácilmente código de proyecto completo, simplificando el proceso de desarrollo. Estas nuevas funciones mejorarán considerablemente la comodidad y la eficiencia de los usuarios durante el proceso de programación.

【Resumen de AiBase:】
🌐 Se añade la función de vista previa en tiempo real de HTML, permitiendo a los usuarios crear intuitivamente minijuegos y páginas web, mejorando la experiencia de desarrollo.
🐍 Se admite la ejecución directa de código Python, con corrección automática de errores mediante IA, lo que reduce el tiempo de depuración.
📦 Se añade la función de generación de código de proyecto completo, simplificando la generación de la lógica de front-end y back-end y mejorando la comodidad de desarrollo.

3. Google Gemini presenta las funciones "Lienzo" y resumen de audio para mejorar la experiencia de colaboración del usuario

Google ha lanzado recientemente la nueva función "Lienzo" para Gemini, con el objetivo de mejorar la experiencia creativa y de colaboración del usuario. Esta función permite a los usuarios editar y compartir fácilmente proyectos de escritura y programación, ofreciendo una forma de colaboración más eficiente. A través de "Lienzo", los usuarios pueden actualizar borradores en tiempo real y generar vistas previas de código. Además, se ha incorporado la función de resumen de audio, que permite a los usuarios generar resúmenes de audio de los documentos. Estas nuevas herramientas convierten a Gemini en un socio creativo más potente, facilitando enormemente el flujo de trabajo de los usuarios.

【Resumen de AiBase:】
📝 La función "Lienzo" permite a los usuarios redactar y editar fácilmente información extensa en Gemini, con soporte para actualizaciones y colaboración en tiempo real.
💻 Ofrece herramientas de programación que permiten a los usuarios generar y previsualizar código HTML y React, viendo los resultados en tiempo real.
🎧 Se añade la función de resumen de audio, que permite a los usuarios generar rápidamente resúmenes de audio de los documentos para facilitar su uso compartido y descarga.

4. Cursor lanza Claude Max, reescribiendo el panorama de la programación con IA

El nuevo modelo Claude Max de Cursor, con su rendimiento excepcional y capacidad innovadora, redefine el estándar de la programación asistida por IA. El modelo tiene una capacidad de procesamiento de contexto excepcional, pudiendo manejar hasta 200.000 palabras a la vez, lo que permite a los desarrolladores gestionar de forma más eficiente toda la base de código del proyecto. Además, Claude Max cuenta con una potente capacidad de llamada a herramientas y comprensión de código, lo que mejora significativamente la eficiencia de la programación.

【Resumen de AiBase:】
🚀 Claude Max tiene una capacidad de procesamiento de contexto de hasta 200.000 palabras, permitiendo a los desarrolladores introducir toda la base de código del proyecto a la vez.
⚙️ Admite hasta 200 llamadas a herramientas, mejorando significativamente la eficiencia de edición y optimización del código.
💰 Se factura por uso, adecuado para usuarios avanzados que necesitan gestionar proyectos complejos, no para tareas de codificación diarias.

5. ¡Adobe lanza 10 agentes de IA! Pueden crear sitios web personalizados para clientes

Adobe vuelve a liderar la tendencia en el campo de la IA generativa lanzando 10 nuevos agentes de IA para mejorar la experiencia del cliente. Estos agentes abarcan varios aspectos, como la interacción con el cliente, la producción de contenido y la gestión de datos, trabajando en conjunto para ayudar a las empresas a gestionar las relaciones con los clientes y optimizar los sitios web de forma más eficiente. Al mismo tiempo, Adobe también ha lanzado una nueva función llamada Brand Concierge, que ofrece una experiencia personalizada de acceso al sitio web, aumentando aún más la participación y la fidelidad de los clientes.

【Resumen de AiBase:】
🤖 Adobe lanza 10 agentes de IA para mejorar la interacción con el cliente y la eficiencia de la producción de contenido.
🌐 La nueva función Brand Concierge ofrece una experiencia de sitio web personalizada, aumentando la participación del cliente.
📈 El tráfico de IA generativa ha aumentado significativamente en los sitios web de comercio minorista y turismo, lo que indica una mayor aceptación de la experiencia de IA por parte de los consumidores.

6. El equipo de grandes modelos de Doubao de ByteDance celebra una reunión general para explorar nuevas alturas en IA

En el contexto del rápido desarrollo de la inteligencia artificial, el equipo de grandes modelos de Doubao de ByteDance celebró una reunión general para definir su dirección futura. La reunión fue presidida conjuntamente por Zhu Wenjia y Wu Yonghui, quienes destacaron la importancia de explorar el límite superior de la inteligencia y animaron a los miembros del equipo a participar en investigaciones desafiantes. Wu Yonghui también propuso aumentar la inversión de recursos en el proyecto Seed Edge para atraer y cultivar talentos de alto nivel.

【Resumen de AiBase:】
🚀 El objetivo principal del equipo Seed es explorar los límites de la inteligencia, realizando investigaciones profundas en torno al plan de investigación de AGI.
💡 Zhu Wenjia anima al equipo a participar en investigaciones de tecnología de IA con incertidumbre, destacando la importancia de los temas desafiantes.
🌍 El equipo planea lanzar modelos Dense de pequeño y mediano tamaño para promover la aplicación de la tecnología y la colaboración externa.

7. Stability AI lanza el nuevo modelo Stable Virtual Camera: convierte fotos 2D en vídeos 3D fácilmente

Stable Virtual Camera, lanzado por Stability AI, es un innovador modelo de inteligencia artificial capaz de convertir imágenes 2D en vídeos inmersivos, proporcionando profundidad y perspectiva realistas. El modelo permite a los usuarios generar nuevas perspectivas a partir de una o varias imágenes, especificando el ángulo de la cámara y admitiendo diversos efectos dinámicos. Sin embargo, la versión actual es todavía una versión preliminar de investigación y existe el riesgo de que la calidad disminuya en escenarios específicos.

【Resumen de AiBase:】
🌟 Stable Virtual Camera puede convertir imágenes 2D en vídeos inmersivos, ofreciendo diversas opciones de trayectoria de cámara.
📉 El modelo actual es una versión preliminar de investigación y puede producirse una disminución de la calidad al procesar ciertas escenas.
💼 Después de una crisis de gestión, Stability AI se está reorganizando activamente y lanzando nuevos productos para mejorar las perspectivas de la empresa.
Enlace de detalles: https://top.aibase.com/tool/stable-virtual-camera

8. ¡1000 billones de cálculos por segundo! Nvidia lanza dos supercomputadoras personales de IA, DGX Spark y DGX Station

En la Conferencia Mundial de Tecnología 2025, Jensen Huang, fundador y CEO de Nvidia, presentó dos supercomputadoras personales de IA revolucionarias, DGX Spark y DGX Station. Estos dispositivos no solo cuentan con una capacidad de cálculo excepcional, alcanzando hasta 1000 billones de cálculos de IA por segundo, sino que también ofrecen nuevas posibilidades para la innovación en el campo de la computación perimetral.

【Resumen de AiBase:】
⚡ DGX Spark tiene una capacidad de cálculo de IA de 1000 billones de operaciones por segundo, utiliza el superchip GB10 Grace Blackwell y es adecuado para el procesamiento de modelos de IA complejos.
🖥️ DGX Station incorpora el superchip GB300 Grace Blackwell Ultra Desktop, con 784 GB de memoria, ofreciendo una experiencia de computación de escritorio excepcional.
🌐 Las dos supercomputadoras de Nvidia están diseñadas para admitir la computación perimetral y ayudar a las empresas a implementar rápidamente el diseño de prototipos y la optimización de modelos de IA.

9. Nvidia lanza el nuevo software Dynamo, con el objetivo de aumentar la velocidad de la IA de DeepSeek 30 veces

En la conferencia GTC del 18 de marzo, Jensen Huang, CEO de Nvidia, anunció el lanzamiento del software Dynamo, con el objetivo de aumentar la velocidad de procesamiento de IA de DeepSeek en 30 veces. Esta medida responde a la conmoción del mercado provocada por el programa de IA R1 de DeepSeek. El software Dynamo puede distribuir tareas de inferencia de IA en hasta 1000 GPU para procesarlas en paralelo, aumentando significativamente el rendimiento de las consultas. Los proveedores de servicios pueden procesar las consultas de los clientes de forma más eficiente, aumentando así sus ingresos.

【Resumen de AiBase:】
🌟 Nvidia lanza el software Dynamo, aumentando significativamente la velocidad de procesamiento de la IA de DeepSeek.
💰 Los proveedores de servicios pueden procesar las consultas de los clientes de forma más eficiente mediante Dynamo, aumentando sus ingresos generales.
🖥️ El nuevo chip Blackwell "Ultra" y la computadora DGX Spark se presentaron oficialmente en la conferencia.

10. Grok lanza la función DeeperSearch, mejorando la capacidad de recuperación de información de IA en tiempo real

Recientemente, el asistente de inteligencia artificial Grok, lanzado por xAI, ha añadido la función DeeperSearch, mejorando significativamente su capacidad de recuperación de información de IA en tiempo real en Twitter. Esta función puede analizar rápidamente los temas candentes de las últimas 48 horas. Los usuarios han dado una respuesta positiva, mostrando la gran capacidad de Grok en el procesamiento de información.

【Resumen de AiBase:】
📰 La función DeeperSearch puede analizar en profundidad la información de IA de actualidad de las últimas 48 horas en Twitter, proporcionando información oportuna.
🚀 La actualización de Grok ha mejorado su capacidad de procesamiento de datos en tiempo real, especialmente en las redes sociales con un flujo de información muy rápido.
🏆 El lanzamiento de esta función proporciona a Grok una ventaja diferencial en la competencia con productos como ChatGPT, mostrando un potencial único.

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

Boletín diario de IA: Kunlun Wanwei lanza el modelo de razonamiento multimodal R1V de código abierto; Doubao AI lanza tres funciones de programación; NVIDIA presenta la supercomputadora de IA personal DGX

站长之家

Este artículo proviene de AIbase Daily