Bienvenido al programa "Diario de IA"! Aquí está tu guía para explorar el mundo de la inteligencia artificial cada día. Cada día te presentamos los temas más destacados en el campo de la IA, enfocándonos en los desarrolladores, para que puedas comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de la IA.
Productos de IA recientes Haga clic para obtener más información:https://app.aibase.com/zh
1. Tencent presenta oficialmente el modelo HUNYUAN 3D 3.0 con una precisión de modelado tres veces mayor
Tencent presentó oficialmente el modelo HUNYUAN 3D 3.0 en la Conferencia Mundial de Ecología Digital de 2025. La tecnología de tallado escalonado 3D-DiT mejora significativamente la precisión del modelado. Además, se lanzó la plataforma HUNYUAN 3D Studio y un plan de código abierto, impulsando el avance de la creación 3D.

【Resumen de AiBase:】
🧠 El modelo HUNYUAN 3D 3.0 utiliza la tecnología de tallado escalonado 3D-DiT, mejorando la precisión del modelado en tres veces.
🎨 La plataforma HUNYUAN 3D Studio ofrece herramientas profesionales para la creación artística 3D, mejorando la eficiencia y la calidad de la creación artística 3D.
🚀 Tencent planea abrir el código fuente del modelo HUNYUAN 3D omni, acelerando la implementación de la tecnología de generación 3D en aplicaciones académicas e industriales.
2. La plataforma de creación musical AI de Kunlun Wanshi, Mureka, lanza la función Agent Studio, haciendo la creación musical accesible para todos
La función «Agent Studio» de Mureka hace que la creación musical sea accesible a través de métodos intuitivos. Solo necesita describir su idea de forma sencilla, y la IA generará automáticamente letras y música. Esta función incluye varios escenarios de creación, como la producción de álbumes y la escritura de canciones populares, ofreciendo así una experiencia musical diversificada a los usuarios.

【Resumen de AiBase:】
🎧 Mureka lanza la función «Agent Studio», permitiendo a personas comunes realizar fácilmente la creación musical.
🤖 Solo necesita decir una idea simple, y la IA genera completamente las letras y la música.
🎶 Actualmente hay seis escenarios de creación, abarcando funciones como la producción de álbumes, la escritura de canciones populares y la expresión emocional.
3. Alibaba Qoder lanza un servicio de suscripción pagado, Pro mensual a 20 dólares, para ayudar a la programación autónoma de IA
Qoder lanza oficialmente un plan de suscripción pagado, con versiones Pro y Pro+, que admiten corrección de código ilimitada y llamadas avanzadas a modelos, mejorando la eficiencia del desarrollo. Al mismo tiempo optimizó el problema del consumo de Credits, mejorando la capacidad de paralelización de las herramientas de agentes inteligentes y la precisión de la búsqueda de ingeniería.

【Resumen de AiBase:】
🔥 Qoder lanza un servicio de suscripción pagado, admitiendo versiones Pro y Pro+ para satisfacer las necesidades de programación eficiente de los desarrolladores.
💡 La versión Pro ofrece corrección de código ilimitada y 2000 Credits, mientras que la versión Pro+ ofrece 6000 Credits y más recursos.
🚀 Optimización del consumo de Credits, mejorando la capacidad de paralelización de las herramientas de agentes inteligentes y reduciendo el consumo de tokens.
4. VEED Fabric 1.0 lanzado! Una imagen se convierte en un video "hablando"
VEED lanzó Fabric 1.0, una herramienta revolucionaria de generación de videos de IA, capaz de generar videos de alta calidad con una imagen y una entrada de voz. Esta herramienta destaca en sincronización de labios, naturalidad de expresiones faciales y velocidad de generación, reduciendo significativamente el costo y el tiempo de producción de videos, adecuado para diversos escenarios de creación de contenido.
【Resumen de AiBase:】
🖼️ Fabric 1.0 admite la generación de videos dinámicos hablando a partir de imágenes estáticas, logrando narrativas dinámicas.
⏱️ La velocidad de generación de videos se ha incrementado 7 veces, y el costo se ha reducido 60 veces, ideal para la producción rápida de contenido.
🌐 Integración de soporte multilingüe y función de subtítulos automáticos, mejorando la experiencia de uso global.
Enlace detallado: https://www.veed.io/ai/fabric-1-0
5. OpenAI lanza GPT-5-Codex: El agente de codificación de IA transformará radicalmente el mundo de los desarrolladores
OpenAI lanzó GPT-5-Codex, lo que marca un gran avance en el campo de la codificación mediante agentes. Su mecanismo de pensamiento dinámico y su capacidad de integración multiplataforma mejoraron significativamente la eficiencia del desarrollo de software.
【Resumen de AiBase:】
🧠 GPT-5-Codex tiene un mecanismo de pensamiento dinámico que puede ajustar el tiempo de procesamiento según la complejidad de la tarea, mejorando la eficiencia de la codificación.
💻 Soporta la integración multiplataforma, incluyendo extensiones de IDE, interfaces web y funciones de revisión de código de GitHub, mejorando la ecosistema de desarrolladores.
🚀 Los comentarios de los desarrolladores muestran que GPT-5-Codex reduce significativamente el ciclo de desarrollo, acelera la generación de código y reduce las anotaciones de errores.
Enlace detallado: https://openai.com/index/introducing-upgrades-to-codex/
6. Se lanzó la versión 2.0 del Marco de Gestión de Seguridad de la Inteligencia Artificial a nivel nacional, impulsando la construcción de un ecosistema de IA seguro y confiable
La versión 2.0 del Marco de Gestión de Seguridad de la Inteligencia Artificial fue oficialmente lanzada el 15 de septiembre de 2025, con el objetivo de enfrentar nuevos desafíos provocados por el rápido desarrollo de la tecnología de IA. Este marco optimizó la versión 1.0, combinando situaciones prácticas, completando la clasificación de riesgos y medidas de prevención, y destacando la importancia de la cooperación global.

【Resumen de AiBase:】
🔐 La versión 2.0 del Marco de Gestión de Seguridad de la Inteligencia Artificial fue lanzada oficialmente, para enfrentar los nuevos desafíos causados por el desarrollo de la tecnología de IA.
🔍 El marco optimiza la versión 1.0, completando la clasificación de riesgos y las medidas de prevención.
🤝 Destaca la cooperación global, promoviendo la cooperación en la gestión de seguridad de la inteligencia artificial bajo mecanismos multilaterales.
Enlace detallado: https://www.cac.gov.cn/2025-09/15/c_1759653448369123.htm
7. OpenAI Evals añade funciones nativas de entrada y evaluación de audio
La herramienta Evals de OpenAI añadió funciones nativas de entrada y evaluación de audio, permitiendo a los desarrolladores cargar directamente archivos de audio para evaluar el rendimiento, lo que aumenta significativamente la eficiencia y la precisión del desarrollo y la evaluación de modelos de reconocimiento y generación de voz.

【Resumen de AiBase:】
🎧 La función de entrada de audio nativa simplifica el proceso de evaluación, mejorando la eficiencia del desarrollo.
🔍 No es necesario transcribir texto para evaluar el rendimiento de modelos de reconocimiento y generación de voz.
💡 Esta nueva función proporciona un apoyo más preciso para asistentes de voz inteligentes y generación de contenido de audio.
8. Revolución tradicional! El modelo de código abierto Mini-o3 realiza razonamiento visual ultra largo, el pensamiento profundo ya no es un problema
Mini-o3 es un modelo de razonamiento visual de código abierto desarrollado conjuntamente por ByteDance y la Universidad de Hong Kong. Puede realizar decenas de rondas de razonamiento visual, mejorando significativamente la capacidad de manejar problemas visuales complejos. Su diseño central incluye el conjunto de datos VisualProbe, el proceso de recolección iterativa de datos y la estrategia de máscara de múltiples rondas, proporcionando una nueva dirección para la tecnología de razonamiento visual de múltiples rondas.

【Resumen de AiBase:】
🧠 Mini-o3 logró la capacidad de razonamiento visual de decenas de rondas, superando las limitaciones anteriores de 1-2 rondas de diálogo.
📊 A través de la construcción del conjunto de datos VisualProbe y el proceso de recolección iterativa de datos, mejoró la capacidad de razonamiento profundo del modelo.
🔄 La estrategia de máscara de múltiples rondas optimizó la eficiencia de entrenamiento, permitiendo que el modelo tenga un mejor rendimiento en la fase de prueba.
Enlace detallado: https://arxiv.org/pdf/2509.07969
9. Shanghai AI Lab lanza Lumina-DiMOO, abriendo nuevas oportunidades en la generación y comprensión multimodal
El Laboratorio de Inteligencia Artificial de Shanghái lanzó conjuntamente con varias universidades el modelo de generación y comprensión multimodal Lumina-DiMOO. Este modelo utiliza una arquitectura inovadora de difusión completamente discreta, y a través de la técnica de aprendizaje por comparación, logra una integración y alineación efectiva de datos de texto, imagen y audio, mejorando significativamente la calidad y la eficiencia de la generación, y mostrando potencial aplicativo amplio en múltiples escenarios.

【Resumen de AiBase:】
🌟 Lumina-DiMOO es un nuevo modelo de generación multimodal, que utiliza una "arquitectura de difusión completamente discreta" innovadora para mejorar la eficiencia del procesamiento de datos.
🛠️ Este modelo logra una alineación y comprensión efectiva de varios tipos de datos, como texto, imágenes, mediante la técnica de aprendizaje por comparación.
🚀 Lumina-DiMOO muestra un excelente rendimiento en la generación e interpretación de imágenes, pudiendo adaptarse a múltiples escenarios de aplicación, demostrando un amplio potencial aplicativo.
Enlace detallado: https://github.com/Alpha-VLLM/Lumina-DiMOO
10. Nueva actualización de pintura AI de Tencent! La tecnología de fine-tuning mejora en un 300% la belleza de las imágenes generadas
La tecnología de fine-tuning introducida por Tencent mejoró significativamente la autenticidad y la calificación estética de las imágenes generadas por IA. Sus métodos innovadores incluyen "Direct-Align" y "optimización de preferencias semánticas relativas", resolviendo eficazmente los problemas de trampas en recompensas y limitaciones de ajuste fuera de línea.

【Resumen de AiBase:】
🧠 La tecnología "Direct-Align" reduce explosiones de gradiente, mejorando la capacidad de optimización del modelo.
🎨 La "optimización de preferencias semánticas relativas" (SRPO) permite controlar el estilo de imagen mediante texto.
📈 Los experimentos muestran que el modelo entrenado con SRPO mejora significativamente en autenticidad y calidad estética.
Enlace detallado: https://arxiv.org/pdf/2509.06942
11. Meta AI lanza MobileLLM-R1: modelo de inferencia en borde ligero, con menos de 1 mil millones de parámetros, rendimiento mejorado significativamente
La serie de modelos MobileLLM-R1 de Meta AI muestra un buen desempeño en el ámbito de la miniaturización y la computación en el borde. Tiene una escala de parámetros desde 140M hasta 950M, enfocándose en matemáticas, programación y razonamiento científico. Este modelo supera a otros modelos en eficiencia de entrenamiento y rendimiento, especialmente en tareas de matemáticas y programación.



