Bienvenido a la sección "Diario de IA"! Aquí es tu guía diaria para explorar el mundo de la inteligencia artificial. Cada día te presentamos los temas más destacados en el campo de la IA, enfocándonos en desarrolladores para que puedas comprender las tendencias tecnológicas y conocer aplicaciones innovadoras de productos de IA.
Productos de IA recientes Haga clic para obtener más información:https://app.aibase.com/zh
1. Shengshu Technology lanza Vidu Q2, la generación de expresiones sutiles hace que la interpretación de IA sea más realista
El modelo Vidu Q2 lanzado por Shengshu Technology ha logrado un gran avance en el ámbito de la generación de videos a partir de imágenes, especialmente en la generación de expresiones sutiles, proporcionando una experiencia visual más realista y viva para la interpretación de IA.
[Resumen de AiBase:]
🎭 Vidu Q2 puede capturar con precisión los cambios sutiles en las expresiones faciales, mejorando la naturalidad y la expresión emocional de los videos generados.
🎥 Soporta múltiples modos de video, incluyendo la generación de videos a partir de imágenes, videos desde el primer y último fotograma, así como opciones ajustables de duración, satisfaciendo diversas necesidades.
💡 Shengshu Technology se dedica a impulsar el desarrollo de la industria creativa mediante la tecnología de IA, brindando a los usuarios una experiencia de creación de imágenes de mayor calidad.
2. Volcán Engine lanza la plataforma Lumi Mi, soporte para ajuste fino de modelos visuales Lora
La plataforma Lumi Mi lanzada por Volcán Engine admite por primera vez la función de ajuste fino de modelos visuales Lora de marcas como Doutou y Jiameng, con el objetivo de ayudar a las empresas a personalizar estilos visuales únicos y satisfacer las necesidades del mercado.
[Resumen de AiBase:]
🧠 La plataforma Lumi Mi admite la función de ajuste fino de modelos visuales Lora, permitiendo a las empresas personalizar estilos visuales únicos.
🚀 La plataforma ofrece servicios completos desde la generación de imágenes hasta la generación de videos, satisfaciendo las necesidades AIGC de escenarios profesionales de las empresas.
💡 La plataforma Lumi Mi ayuda a las empresas a construir eficientemente capacidades de producción AIGC personalizadas, mejorando la experiencia del usuario.
3. El CTO de Alibaba Cloud revela: Tongyi Qianwen ha abierto al público más de 300 modelos, con más de 600 millones de descargas
Alibaba Cloud mostró en la conferencia Cloud栖 2025 los notables logros del proyecto Tongyi Qianwen, incluyendo más de 300 modelos abiertos al público y más de 600 millones de descargas. Esto demuestra la fuerte influencia y capacidad técnica de Alibaba Cloud en el campo de la IA, y también promueve la innovación tecnológica y la implementación de aplicaciones mediante modelos abiertos.
[Resumen de AiBase:]
🚀 El proyecto Tongyi Qianwen ha abierto más de 300 modelos, demostrando una sólida capacidad técnica.
📊 El número total de descargas supera los 600 millones, lo que indica la alta aceptación de la tecnología de IA de Alibaba Cloud por parte de los usuarios.
🖼️ Tongyi Wanxiang ha generado más de 390 millones de imágenes y más de 70 millones de videos, destacando su capacidad para generar contenido digital.
4. Baidu lanza públicamente el modelo Qianfan-VL,昆仑芯 impulsa nuevos avances en IA multimodal
Baidu lanzó públicamente su nuevo modelo de comprensión visual Qianfan-VL, disponible en tres versiones: 3B, 8B y 70B, adecuado para diferentes escenarios. Este modelo posee una poderosa capacidad multimodal, destacando especialmente en OCR y educación, y su entrenamiento depende de la tarjeta P800 Kunlun X de su propia fabricación.
[Resumen de AiBase:]
🧠 Qianfan-VL es un modelo grande multimodal poderoso capaz de procesar información de imágenes y texto simultáneamente.
💡 La tarjeta Kunlun X P800 respalda el entrenamiento del modelo, con bajo consumo de energía y alta eficiencia, optimizando el rendimiento de cálculo a gran escala.
🚀 La serie Qianfan-VL está disponible en GitHub y Hugging Face para uso libre por parte de los desarrolladores.
Enlace detallado: https://github.com/baidubce/Qianfan-VL
5. Microsoft introduce modelos de AI de Anthropic, ampliando las funciones del asistente Copilot
Microsoft anunció que introducirá los modelos de AI de Anthropic en Copilot, marcando un nuevo paso en su estrategia diversificada en el campo de la inteligencia artificial generativa. Aunque la cooperación con OpenAI sigue siendo estrecha, Microsoft comienza a incorporar la tecnología de Anthropic para satisfacer las necesidades de clientes empresariales. Los usuarios empresariales ahora pueden utilizar los modelos de Anthropic para construir agentes de IA, y estos modelos operarán en Amazon y Google Cloud.
[Resumen de AiBase:]
🤖 Microsoft introduce los modelos de IA de Anthropic en Copilot, impulsando la diversificación del producto.
🔄 Aunque la relación con OpenAI sigue siendo estrecha, Microsoft está comenzando a utilizar la tecnología de Anthropic.
🚀 Los usuarios empresariales pueden elegir los modelos de Anthropic para construir agentes de IA, y deberán ser habilitados por un administrador antes de su uso.
6. OpenAI construye cinco centros de datos adicionales en EE.UU., acelerando el rápido desarrollo del proyecto Stargate
OpenAI anunció que construirá cinco centros de datos adicionales en Estados Unidos para mejorar la capacidad de cálculo del proyecto Stargate. Este proyecto, impulsado por varias empresas, tiene una inversión total de 50 mil millones de dólares, con el objetivo de impulsar el desarrollo de la inteligencia artificial generativa.
[Resumen de AiBase:]
🌐 OpenAI construirá cinco centros de datos adicionales en EE.UU., y la capacidad total de cálculo del proyecto Stargate alcanzará casi 7 GW.
💼 Oracle se encargará de construir tres nuevos centros de datos, y el centro de datos de Abilene se ampliará aumentando su capacidad de cálculo en 600 MW.
🚀 OpenAI planea aumentar semanalmente en 1 GW la infraestructura de inteligencia artificial, con el fin de impulsar el desarrollo adicional de la tecnología de IA.
7. NVIDIA libera el modelo Audio2Face, la IA ayuda a la generación de animación facial en tiempo real
NVIDIA liberó su modelo de animación facial de IA generativa Audio2Face, que proporciona SDK y marcos de entrenamiento, apoyando el procesamiento en modo offline y en tiempo real, y es adecuado para diversos campos como juegos y cine. Esta tecnología ha sido adoptada por varios desarrolladores de videojuegos, mejorando la autenticidad y la inmersión de los personajes.
[Resumen de AiBase:]
🔊 NVIDIA libera el modelo Audio2Face, mejorando la tecnología de generación de animación facial virtual.
🎮 Soporta renderizado offline y procesamiento en streaming en tiempo real, adecuado para múltiples escenarios.
🌟 Ha sido adoptado por varios desarrolladores de videojuegos, simplificando el proceso de producción y mejorando la autenticidad de los personajes.
Enlace detallado: https://build.nvidia.com/nvidia/audio2face-3d
8. Meta lanza el modelo de mundo de código CWM: un AI de 32B con capacidad de simulación en entorno de sandbox
El modelo de mundo de código (CWM) lanzado por Meta es un sistema de IA con 32B parámetros que puede simular y razonar código a través de un entorno de sandbox, reduciendo errores y mejorando la eficiencia de depuración. Este modelo requiere hardware muy avanzado, necesitando dos tarjetas gráficas H100 y tecnología RDMA.
[Resumen de AiBase:]
🧠 CWM simula en un entorno de sandbox antes de generar código, predecir los resultados de la ejecución del código.
🔍 Puede identificar rápidamente errores de código, mejorando la eficiencia de la depuración.
🚨 Puede alertar sobre riesgos potenciales antes de ejecutar comandos, mejorando la seguridad.
Enlace detallado: https://github.com/facebookresearch/cwm