Tencent abre el código de la biblioteca de entrenamiento de modelos WeChat-YATT, rompe dos principales obstáculos en el entrenamiento multimodal

AIbase基地

Publicado elNoticias de IA · 9 minutos de lectura · Aug 19, 2025

20.6k

El viernes, Tencent lanzó un marco de entrenamiento de modelos grandes llamado WeChat-YATT (Yet Another Transformer Trainer), desarrollado basado en Megatron-Core y SGLang/vLLM, con el código interno de proyecto gCore. Este marco de entrenamiento se enfoca en el aprendizaje por refuerzo y el entrenamiento de modelos multimodales, comprometiéndose a proporcionar soluciones para el entrenamiento de modelos grandes que sean fáciles de extender, simples, eficientes y confiables para los desarrolladores.

WeChat-YATT puede manejar eficazmente escenarios complejos como modelos de gran tamaño, entradas de secuencias largas y conjuntos de datos grandes mediante estrategias personalizadas de cálculo paralelo, resolviendo con éxito problemas clave en varios escenarios empresariales internos de WeChat, mejorando significativamente la eficiencia del entrenamiento de modelos grandes. Esta herramienta ofrece a investigadores y desarrolladores una solución técnica flexible y escalable, con el potencial de impulsar la innovación y el desarrollo en los campos de la visión multimodal y el aprendizaje por refuerzo.

WeChat-YATT aborda principalmente dos principales barreras técnicas en el proceso de entrenamiento distribuido de modelos grandes.

En primer lugar, el problema de la escabilidad en escenarios multimodales. A medida que el tamaño de los datos multimodales como imágenes y videos aumenta constantemente, el método tradicional de gestión de datos mediante un único controlador tiende a convertirse en un cuello de botella de comunicación y memoria, limitando así el rendimiento del sistema e incluso causando interrupciones en el proceso de entrenamiento. WeChat-YATT resuelve este problema mediante un mecanismo de gestión paralela introduciendo controladores paralelos (Parallel Controller), reduciendo efectivamente la presión del sistema y mejorando significativamente la escalabilidad y estabilidad del sistema, permitiéndole manejar mejor escenarios complejos de multimodalidad y grandes volúmenes de datos.

En segundo lugar, la brecha de eficiencia en la muestra dinámica y el cálculo de recompensas generativas. En flujos de trabajo de entrenamiento que requieren muestras dinámicas frecuentes o cálculos de recompensas generativas, los cambios frecuentes del modelo y las tareas de "cola larga" generan una gran cantidad de costos adicionales, impidiendo que se utilice plenamente la capacidad de cálculo de GPU y afectando gravemente la eficiencia general del entrenamiento. WeChat-YATT reduce eficazmente el costo de cambio del modelo y el impacto de las tareas de cola larga mediante estrategias de coexistencia parcial y mecanismos de interacción asincrónica, logrando así alta capacidad de procesamiento y alta utilización de recursos durante el proceso de entrenamiento, apoyando así de manera más eficiente la iteración de tareas RLHF a gran escala.

Para satisfacer las necesidades de diferentes escenarios empresariales, WeChat-YATT admite dos modos de colocación de recursos: coexistencia total y coexistencia parcial, maximizando así la utilización de los recursos del clúster.

El modo de coexistencia total utiliza un mecanismo de programación secuencial, donde Actor Rollouts, GenRM (modelo de recompensa generativa) y Train se ejecutan secuencialmente. Una vez que cada rol completa su tarea, libera activamente los recursos de cálculo y el sistema carga inmediatamente el siguiente modelo necesario. Esta estrategia es adecuada para la mayoría de los escenarios de entrenamiento convencionales. Destaca el hecho de que, en cada etapa, los componentes relacionados pueden utilizar exclusivamente todos los recursos de GPU, lo que reduce significativamente el tiempo de inactividad "burbuja" de los recursos y mejora notablemente el rendimiento general de la capacidad de procesamiento y la eficiencia del entrenamiento.

En el modo de coexistencia parcial, Actor Rollouts y GenRM se despliegan de forma independiente y se comunican de manera eficiente mediante métodos asincrónicos. Durante la fase de entrenamiento de Actor, se ocupan todos los recursos de GPU, y durante la fase de generación de Rollouts, se liberan los recursos de GPU y se activan los componentes Actor Rollouts y GenRM para trabajar juntos. El sistema asigna y equilibra los recursos dinámicamente. Una vez que se completan los Rollouts, estos dos componentes liberan los recursos, y Actor vuelve a cargarlos en la GPU para ingresar a la siguiente ronda de entrenamiento. Este modo de coexistencia parcial es especialmente adecuado para escenarios de tareas complejas donde Actor Rollouts y GenRM requieren interacciones frecuentes y muestreo dinámico.

WeChat-YATT también cuenta con varias características técnicas destacadas. En cuanto al uso de memoria, el proyecto utiliza una arquitectura de controlador paralelo, reduciendo eficazmente el consumo de memoria en un nodo, lo que lo hace más adecuado para el entrenamiento de modelos grandes en escenarios multimodales, mejorando así la escalabilidad y estabilidad del sistema. En cuanto al soporte de GenRM, se han implementado estrategias diferentes de colocación de recursos para escenarios de modelos de recompensa generativa, permitiendo a los usuarios elegir la solución de entrenamiento óptima según su escenario específico.

La estrategia inteligente de puntos de verificación es otra característica destacada. WeChat-YATT admite la guardado asincrónico de puntos de verificación y, según las características del escenario empresarial de WeChat, guarda automáticamente los puntos de verificación según el flujo de programación, garantizando así de manera adicional la seguridad del entrenamiento y la alta disponibilidad. Además, el sistema logra un equilibrio de carga entre los grupos de paralelismo de datos durante el entrenamiento, reduciendo eficazmente el tiempo de inactividad de los recursos y mejorando significativamente la capacidad de procesamiento general del entrenamiento.

La publicación de este marco de entrenamiento marca un importante avance en la construcción de infraestructura tecnológica de modelos grandes de Tencent, y también ofrece una solución efectiva para escenarios complejos de entrenamiento multimodal a la industria.

Los ingresos de IA superan los 10.000 millones de yuanes! El informe financiero del segundo trimestre de Baidu en 2025 es destacable, con la búsqueda inteligente y Robotaxi como motores de crecimiento

Hoy, Baidu publicó su informe financiero del segundo trimestre de 2025, que muestra que los ingresos totales de la empresa alcanzaron los 32.700 millones de yuanes, de los cuales los ingresos del Core de Baidu alcanzaron los 26.300 millones de yuanes. Destaca que los ingresos de sus nuevas actividades de IA superaron por primera vez los 10.000 millones de yuanes, lo que representa un crecimiento del 34% en comparación con el año anterior, convirtiéndose en un motor principal para impulsar el desempeño de la empresa. Los datos financieros muestran que la inversión de Baidu en la tecnología de IA ha mejorado significativamente sus operaciones principales. La búsqueda de Baidu se ha renovado completamente desde el campo de búsqueda hasta la página de resultados. En julio de este año, el contenido generado por IA en la página de resultados de búsqueda móvil ya representaba el 64%.

Diario de IA: DeepSeek V3.1 se lanza oficialmente; WeChat Empresarial 5.0 presenta nuevas capacidades de IA; El modelo Klear-Reasoner de Kuaishou logra el primer lugar

¡Bienvenido al programa 【Diario de IA】! Es tu guía para explorar el mundo de la inteligencia artificial cada día. Cada día te presentamos los temas más destacados en el campo de la IA, enfocándonos en desarrolladores y ayudándote a comprender las tendencias tecnológicas y aplicaciones innovadoras de productos de IA. Descubre productos de IA recientes: https://top.aibase.com/1. DeepSeek V3.1 se lanza oficialmente: capacidad de análisis de documentos largos y comprensión de código mejoradas, aún se espera R2. El modelo DeepSeek V3.1 mejora significativamente en longitud de contexto y tareas de razonamiento en múltiples pasos

¡El WeChat Empresarial 5.0 se equipa con inteligencia artificial! Introduce búsqueda inteligente y resúmenes, dejando atrás los flujos de trabajo complicados

El 20 de agosto, Tencent lanzó oficialmente la versión WeChat Empresarial 5.0 en Guangdong, marcando un importante paso en el campo de oficina inteligente. Esta actualización aplica completamente la tecnología de IA, con el objetivo de mejorar significativamente la eficiencia empresarial y satisfacer las crecientes necesidades de internacionalización y seguridad de datos. Actualmente, WeChat Empresarial sirve a más de 14 millones de empresas y organizaciones, brindando servicios diarios a más de 750 millones de usuarios de WeChat. Seis funciones de IA: un nuevo motor para la eficiencia laboral. El punto más destacado de esta nueva versión es la introducción de seis funciones de IA, que cubren desde la recuperación de información hasta la gestión del conocimiento.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Tools Directory

Building and Deploying AI

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

Tencent abre el código de la biblioteca de entrenamiento de modelos WeChat-YATT, rompe dos principales obstáculos en el entrenamiento multimodal

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Zhigu AI lanza un producto revolucionario: AutoGLM 2.0, una voz puede reemplazar el control con las manos en todo el internet

El Google Pixel Buds se actualiza con un gran impacto: el control de gestos de IA impulsa una revolución en los auriculares, ¡la tecnología de ruido cancelado a solo 130 dólares!

La vulnerabilidad de la extensión Perplexity Comet del navegador fue atacada por instrucciones maliciosas, ha sido corregida pero hay que estar alerta

Los ingresos de IA superan los 10.000 millones de yuanes! El informe financiero del segundo trimestre de Baidu en 2025 es destacable, con la búsqueda inteligente y Robotaxi como motores de crecimiento

Diario de IA: DeepSeek V3.1 se lanza oficialmente; WeChat Empresarial 5.0 presenta nuevas capacidades de IA; El modelo Klear-Reasoner de Kuaishou logra el primer lugar

¡El WeChat Empresarial 5.0 se equipa con inteligencia artificial! Introduce búsqueda inteligente y resúmenes, dejando atrás los flujos de trabajo complicados

OpenAI planea convertirse en la empresa privada más valiosa del mundo mediante la venta de acciones, con una valoración de 500 mil millones de dólares

Casi el 90 % de los desarrolladores de juegos ya utilizan herramientas de inteligencia artificial en su trabajo

WeChat Work 5.0 se lanza oficialmente: nuevas funciones inteligentes de IA para un trabajo eficiente

Lanzamiento oficial de DeepSeek V3.1: capacidad de análisis de documentos largos y comprensión de código mejoradas, R2 aún debe esperar