Diario de IA: Tencent lanza el modelo Huan Yuan 3D 3.0; Kunlun Wanzhi presenta la función Agent Studio; Alibaba Qoder lanza un servicio de suscripción pagado

站长之家

Publicado elNoticias de IA · 17 minutos de lectura · Sep 16, 2025

Bienvenido al programa "Diario de IA"! Aquí está tu guía para explorar el mundo de la inteligencia artificial cada día. Cada día te presentamos los temas más destacados en el campo de la IA, enfocándonos en los desarrolladores, para que puedas comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de la IA.

Productos de IA recientes Haga clic para obtener más información:https://app.aibase.com/zh

1. Tencent presenta oficialmente el modelo HUNYUAN 3D 3.0 con una precisión de modelado tres veces mayor

Tencent presentó oficialmente el modelo HUNYUAN 3D 3.0 en la Conferencia Mundial de Ecología Digital de 2025. La tecnología de tallado escalonado 3D-DiT mejora significativamente la precisión del modelado. Además, se lanzó la plataforma HUNYUAN 3D Studio y un plan de código abierto, impulsando el avance de la creación 3D.

【Resumen de AiBase:】
🧠 El modelo HUNYUAN 3D 3.0 utiliza la tecnología de tallado escalonado 3D-DiT, mejorando la precisión del modelado en tres veces.
🎨 La plataforma HUNYUAN 3D Studio ofrece herramientas profesionales para la creación artística 3D, mejorando la eficiencia y la calidad de la creación artística 3D.
🚀 Tencent planea abrir el código fuente del modelo HUNYUAN 3D omni, acelerando la implementación de la tecnología de generación 3D en aplicaciones académicas e industriales.

2. La plataforma de creación musical AI de Kunlun Wanshi, Mureka, lanza la función Agent Studio, haciendo la creación musical accesible para todos

La función «Agent Studio» de Mureka hace que la creación musical sea accesible a través de métodos intuitivos. Solo necesita describir su idea de forma sencilla, y la IA generará automáticamente letras y música. Esta función incluye varios escenarios de creación, como la producción de álbumes y la escritura de canciones populares, ofreciendo así una experiencia musical diversificada a los usuarios.

【Resumen de AiBase:】
🎧 Mureka lanza la función «Agent Studio», permitiendo a personas comunes realizar fácilmente la creación musical.
🤖 Solo necesita decir una idea simple, y la IA genera completamente las letras y la música.
🎶 Actualmente hay seis escenarios de creación, abarcando funciones como la producción de álbumes, la escritura de canciones populares y la expresión emocional.

3. Alibaba Qoder lanza un servicio de suscripción pagado, Pro mensual a 20 dólares, para ayudar a la programación autónoma de IA

Qoder lanza oficialmente un plan de suscripción pagado, con versiones Pro y Pro+, que admiten corrección de código ilimitada y llamadas avanzadas a modelos, mejorando la eficiencia del desarrollo. Al mismo tiempo optimizó el problema del consumo de Credits, mejorando la capacidad de paralelización de las herramientas de agentes inteligentes y la precisión de la búsqueda de ingeniería.

【Resumen de AiBase:】
🔥 Qoder lanza un servicio de suscripción pagado, admitiendo versiones Pro y Pro+ para satisfacer las necesidades de programación eficiente de los desarrolladores.
💡 La versión Pro ofrece corrección de código ilimitada y 2000 Credits, mientras que la versión Pro+ ofrece 6000 Credits y más recursos.
🚀 Optimización del consumo de Credits, mejorando la capacidad de paralelización de las herramientas de agentes inteligentes y reduciendo el consumo de tokens.

4. VEED Fabric 1.0 lanzado! Una imagen se convierte en un video "hablando"

VEED lanzó Fabric 1.0, una herramienta revolucionaria de generación de videos de IA, capaz de generar videos de alta calidad con una imagen y una entrada de voz. Esta herramienta destaca en sincronización de labios, naturalidad de expresiones faciales y velocidad de generación, reduciendo significativamente el costo y el tiempo de producción de videos, adecuado para diversos escenarios de creación de contenido.

【Resumen de AiBase:】
🖼️ Fabric 1.0 admite la generación de videos dinámicos hablando a partir de imágenes estáticas, logrando narrativas dinámicas.
⏱️ La velocidad de generación de videos se ha incrementado 7 veces, y el costo se ha reducido 60 veces, ideal para la producción rápida de contenido.
🌐 Integración de soporte multilingüe y función de subtítulos automáticos, mejorando la experiencia de uso global.
Enlace detallado: https://www.veed.io/ai/fabric-1-0

5. OpenAI lanza GPT-5-Codex: El agente de codificación de IA transformará radicalmente el mundo de los desarrolladores

OpenAI lanzó GPT-5-Codex, lo que marca un gran avance en el campo de la codificación mediante agentes. Su mecanismo de pensamiento dinámico y su capacidad de integración multiplataforma mejoraron significativamente la eficiencia del desarrollo de software.

【Resumen de AiBase:】
🧠 GPT-5-Codex tiene un mecanismo de pensamiento dinámico que puede ajustar el tiempo de procesamiento según la complejidad de la tarea, mejorando la eficiencia de la codificación.
💻 Soporta la integración multiplataforma, incluyendo extensiones de IDE, interfaces web y funciones de revisión de código de GitHub, mejorando la ecosistema de desarrolladores.
🚀 Los comentarios de los desarrolladores muestran que GPT-5-Codex reduce significativamente el ciclo de desarrollo, acelera la generación de código y reduce las anotaciones de errores.
Enlace detallado: https://openai.com/index/introducing-upgrades-to-codex/

6. Se lanzó la versión 2.0 del Marco de Gestión de Seguridad de la Inteligencia Artificial a nivel nacional, impulsando la construcción de un ecosistema de IA seguro y confiable

La versión 2.0 del Marco de Gestión de Seguridad de la Inteligencia Artificial fue oficialmente lanzada el 15 de septiembre de 2025, con el objetivo de enfrentar nuevos desafíos provocados por el rápido desarrollo de la tecnología de IA. Este marco optimizó la versión 1.0, combinando situaciones prácticas, completando la clasificación de riesgos y medidas de prevención, y destacando la importancia de la cooperación global.

【Resumen de AiBase:】
🔐 La versión 2.0 del Marco de Gestión de Seguridad de la Inteligencia Artificial fue lanzada oficialmente, para enfrentar los nuevos desafíos causados por el desarrollo de la tecnología de IA.
🔍 El marco optimiza la versión 1.0, completando la clasificación de riesgos y las medidas de prevención.
🤝 Destaca la cooperación global, promoviendo la cooperación en la gestión de seguridad de la inteligencia artificial bajo mecanismos multilaterales.
Enlace detallado: https://www.cac.gov.cn/2025-09/15/c_1759653448369123.htm

7. OpenAI Evals añade funciones nativas de entrada y evaluación de audio

La herramienta Evals de OpenAI añadió funciones nativas de entrada y evaluación de audio, permitiendo a los desarrolladores cargar directamente archivos de audio para evaluar el rendimiento, lo que aumenta significativamente la eficiencia y la precisión del desarrollo y la evaluación de modelos de reconocimiento y generación de voz.

【Resumen de AiBase:】
🎧 La función de entrada de audio nativa simplifica el proceso de evaluación, mejorando la eficiencia del desarrollo.
🔍 No es necesario transcribir texto para evaluar el rendimiento de modelos de reconocimiento y generación de voz.
💡 Esta nueva función proporciona un apoyo más preciso para asistentes de voz inteligentes y generación de contenido de audio.

8. Revolución tradicional! El modelo de código abierto Mini-o3 realiza razonamiento visual ultra largo, el pensamiento profundo ya no es un problema

Mini-o3 es un modelo de razonamiento visual de código abierto desarrollado conjuntamente por ByteDance y la Universidad de Hong Kong. Puede realizar decenas de rondas de razonamiento visual, mejorando significativamente la capacidad de manejar problemas visuales complejos. Su diseño central incluye el conjunto de datos VisualProbe, el proceso de recolección iterativa de datos y la estrategia de máscara de múltiples rondas, proporcionando una nueva dirección para la tecnología de razonamiento visual de múltiples rondas.

【Resumen de AiBase:】
🧠 Mini-o3 logró la capacidad de razonamiento visual de decenas de rondas, superando las limitaciones anteriores de 1-2 rondas de diálogo.
📊 A través de la construcción del conjunto de datos VisualProbe y el proceso de recolección iterativa de datos, mejoró la capacidad de razonamiento profundo del modelo.
🔄 La estrategia de máscara de múltiples rondas optimizó la eficiencia de entrenamiento, permitiendo que el modelo tenga un mejor rendimiento en la fase de prueba.
Enlace detallado: https://arxiv.org/pdf/2509.07969

9. Shanghai AI Lab lanza Lumina-DiMOO, abriendo nuevas oportunidades en la generación y comprensión multimodal

El Laboratorio de Inteligencia Artificial de Shanghái lanzó conjuntamente con varias universidades el modelo de generación y comprensión multimodal Lumina-DiMOO. Este modelo utiliza una arquitectura inovadora de difusión completamente discreta, y a través de la técnica de aprendizaje por comparación, logra una integración y alineación efectiva de datos de texto, imagen y audio, mejorando significativamente la calidad y la eficiencia de la generación, y mostrando potencial aplicativo amplio en múltiples escenarios.

【Resumen de AiBase:】
🌟 Lumina-DiMOO es un nuevo modelo de generación multimodal, que utiliza una "arquitectura de difusión completamente discreta" innovadora para mejorar la eficiencia del procesamiento de datos.
🛠️ Este modelo logra una alineación y comprensión efectiva de varios tipos de datos, como texto, imágenes, mediante la técnica de aprendizaje por comparación.
🚀 Lumina-DiMOO muestra un excelente rendimiento en la generación e interpretación de imágenes, pudiendo adaptarse a múltiples escenarios de aplicación, demostrando un amplio potencial aplicativo.
Enlace detallado: https://github.com/Alpha-VLLM/Lumina-DiMOO

10. Nueva actualización de pintura AI de Tencent! La tecnología de fine-tuning mejora en un 300% la belleza de las imágenes generadas

La tecnología de fine-tuning introducida por Tencent mejoró significativamente la autenticidad y la calificación estética de las imágenes generadas por IA. Sus métodos innovadores incluyen "Direct-Align" y "optimización de preferencias semánticas relativas", resolviendo eficazmente los problemas de trampas en recompensas y limitaciones de ajuste fuera de línea.

【Resumen de AiBase:】
🧠 La tecnología "Direct-Align" reduce explosiones de gradiente, mejorando la capacidad de optimización del modelo.
🎨 La "optimización de preferencias semánticas relativas" (SRPO) permite controlar el estilo de imagen mediante texto.
📈 Los experimentos muestran que el modelo entrenado con SRPO mejora significativamente en autenticidad y calidad estética.
Enlace detallado: https://arxiv.org/pdf/2509.06942

11. Meta AI lanza MobileLLM-R1: modelo de inferencia en borde ligero, con menos de 1 mil millones de parámetros, rendimiento mejorado significativamente

La serie de modelos MobileLLM-R1 de Meta AI muestra un buen desempeño en el ámbito de la miniaturización y la computación en el borde. Tiene una escala de parámetros desde 140M hasta 950M, enfocándose en matemáticas, programación y razonamiento científico. Este modelo supera a otros modelos en eficiencia de entrenamiento y rendimiento, especialmente en tareas de matemáticas y programación.

Diario de IA: Tencent presenta una nueva IMA 2.0; Microsoft lanza una serie de actualizaciones importantes para Copilot; Alibaba Quark presentó la venta anticipada de gafas de IA

【Diario de IA】El modelo Kimi k2 de la empresa Lado Oscuro de la Luna ha recibido elogios por su rendimiento superior al GPT-5, y la empresa está a punto de completar una nueva financiación de cientos de millones de dólares, solo unos meses después de la última financiación. El sector de grandes modelos de IA en China sigue siendo muy activo, y los desarrolladores pueden conocer las últimas actualizaciones de productos a través de la plataforma.

Tencent lanza la nueva versión de IMA 2.0: se presenta el modo de tareas, se añaden funciones como «Puntos de IA»

El 23 de octubre, Tencent presentó oficialmente la nueva versión actualizada de IMA 2.0 en el evento IMA Open Day. Como la primera biblioteca de conocimiento personal que integra capacidad de Agente en la industria, IMA 2.0 lanzó el «modo de tareas», convirtiendo a la biblioteca de conocimiento de una herramienta de búsqueda y preguntas simples en un compañero inteligente capaz de comprender tareas complejas, desglosar pasos por sí mismo, utilizar herramientas y completar todo el proceso.

El equipo Seed de ByteDance anuncia el lanzamiento del modelo grande de generación 3D Seed 3D 1.0

El equipo Seed de ByteDance anunció recientemente el lanzamiento del modelo grande de generación 3D Seed3D1.0, que puede generar modelos 3D de alta calidad de forma end-to-end a partir de una sola imagen, incluyendo geometría detallada, texturas realistas y materiales basados en renderizado físico (PBR). Este logro innovador promete proporcionar un potente simulador del mundo para el desarrollo de inteligencia corporal, resolviendo los cuellos de botella en las capacidades de interacción física y la diversidad de contenido en la tecnología actual. Durante el desarrollo, el equipo Seed recopiló y procesó una gran cantidad de datos 3D de alta calidad, construyendo una completa tres

Tencent lanza AI Gongkao Tong, obtener información de examen público se vuelve más fácil

El navegador QQ de Tencent lanzó la función gratuita "AI Gongkao Tong", diseñada específicamente para los candidatos del examen público, proporcionando un servicio de selección inteligente de puestos. Esta función utiliza la tecnología de Tencent Cloud para integrar en tiempo real información de miles de centros de reclutamiento en todo el país, ayudando a los candidatos a acceder fácilmente a anuncios de reclutamiento y recomendaciones de puestos en diferentes lugares, resolviendo así el problema de obtención de información.

Tencent propone un método de optimización sin entrenamiento: logra el mismo efecto que la fine-tuning tradicional de 70.000 yuanes con un costo de 120 yuanes

Tencent lanzó la tecnología GRPO sin entrenamiento, que reemplaza el ajuste de parámetros mediante una base de conocimiento externa, logrando una optimización del rendimiento en estado de congelación de los parámetros del modelo. Este método convierte el conocimiento experimental en información previa a nivel de token, reduciendo significativamente los costos de entrenamiento y obteniendo resultados comparables al ajuste costoso en el modelo DeepSeek-V3.1-Terminus.

Tencent lanza Youtu-Embedding: para ayudar a los servicios inteligentes empresariales

El Laboratorio YouTu de Tencent ha abierto el modelo de representación de texto Youtu-Embedding, mejorando la eficiencia del servicio de atención al cliente inteligente y la gestión de bases de conocimiento empresarial. Este modelo evita respuestas engañosas generadas por modelos grandes en áreas específicas mediante una extracción precisa de información, resolviendo el problema de respuestas irrelevantes causado por materiales generales, y aborda efectivamente la mala performance en múltiples dominios.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Ranking Monitor

AI Conversation Insight

GEO Promotion Link Detection

Website AI Friendliness Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

LLM API Proxy Checker

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

Diario de IA: Tencent lanza el modelo Huan Yuan 3D 3.0; Kunlun Wanzhi presenta la función Agent Studio; Alibaba Qoder lanza un servicio de suscripción pagado

站长之家

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Tencent lanza un nuevo programador de IA Ada para ayudar a los desarrolladores a mejorar su eficiencia

¡El modelo de gran escala DeepGEM se implementa! Jinyu Medical se une a Tencent y el Hospital First de Guangdong para utilizar la IA para leer con precisión el código genético del cáncer

Diario de IA: Tencent presenta una nueva IMA 2.0; Microsoft lanza una serie de actualizaciones importantes para Copilot; Alibaba Quark presentó la venta anticipada de gafas de IA

Tencent lanza la nueva versión de IMA 2.0: se presenta el modo de tareas, se añaden funciones como «Puntos de IA»

El equipo Seed de ByteDance anuncia el lanzamiento del modelo grande de generación 3D Seed 3D 1.0

La versión 1.1 del modelo Hunyuan World se presenta oficialmente: revolucionando la tecnología de reconstrucción 3D, generación de escenas de alta calidad en segundos

El equipo de Li Feifei presenta RTFM: generación en tiempo real del mundo 3D con una sola tarjeta H100

Tencent lanza AI Gongkao Tong, obtener información de examen público se vuelve más fácil

Tencent propone un método de optimización sin entrenamiento: logra el mismo efecto que la fine-tuning tradicional de 70.000 yuanes con un costo de 120 yuanes

Tencent lanza Youtu-Embedding: para ayudar a los servicios inteligentes empresariales

Noticias de IA relacionadas recomendadas

Tencent lanza un nuevo programador de IA Ada para ayudar a los desarrolladores a mejorar su eficiencia

¡El modelo de gran escala DeepGEM se implementa! Jinyu Medical se une a Tencent y el Hospital First de Guangdong para utilizar la IA para leer con precisión el código genético del cáncer

Diario de IA: Tencent presenta una nueva IMA 2.0; Microsoft lanza una serie de actualizaciones importantes para Copilot; Alibaba Quark presentó la venta anticipada de gafas de IA

Tencent lanza la nueva versión de IMA 2.0: se presenta el modo de tareas, se añaden funciones como «Puntos de IA»

El equipo Seed de ByteDance anuncia el lanzamiento del modelo grande de generación 3D Seed 3D 1.0

La versión 1.1 del modelo Hunyuan World se presenta oficialmente: revolucionando la tecnología de reconstrucción 3D, generación de escenas de alta calidad en segundos

El equipo de Li Feifei presenta RTFM: generación en tiempo real del mundo 3D con una sola tarjeta H100

Tencent lanza AI Gongkao Tong, obtener información de examen público se vuelve más fácil

Tencent propone un método de optimización sin entrenamiento: logra el mismo efecto que la fine-tuning tradicional de 70.000 yuanes con un costo de 120 yuanes

Tencent lanza Youtu-Embedding: para ayudar a los servicios inteligentes empresariales