La plataforma de código abierto mundialmente conocida, Hugging Face, ha publicado recientemente una lista de contribuciones de modelos con pesos abiertos, donde los equipos chinos Qwen y DeepSeek han logrado entrar en el top 15, demostrando la capacidad técnica e influencia de China en el ámbito global del AI de código abierto. Esta lista reconoce a los equipos que proporcionan pesos de modelos de alta calidad a la comunidad de código abierto, cuyos modelos se utilizan ampliamente tanto en innovación académica como industrial.
El equipo Qwen, respaldado por Alibaba Cloud Intelligence Group, ha captado la atención de la comunidad gracias al excelente rendimiento de sus modelos Qwen3 en tareas como seguimiento de instrucciones y generación de código. La serie Qwen2.5-72B ocupa un lugar destacado entre los grandes modelos de lenguaje abierto, mientras que su modelo ligero QwQ-32B, optimizado mediante aprendizaje por refuerzo, compite con modelos más grandes en razonamiento matemático y generación de código, reduciendo significativamente los costos de implementación.
Por otro lado, DeepSeek es conocido por sus modelos R1, que ofrecen un alto rendimiento a bajo costo. El modelo R1-0528 superó a varios competidores internacionales en el ranking LiveCodeBench, quedando solo detrás de los modelos de vanguardia de OpenAI. Su versión ligera DeepSeek-R1-0528-Qwen3-8B, optimizada mediante técnicas de destilación del conocimiento, puede ejecutarse en una sola GPU y superó a Google Gemini2.5 Flash en la prueba de matemáticas AIME2025, mostrando una ventaja competitiva en ciertos campos.
El ingreso de Qwen y DeepSeek en la lista refleja el ascenso de los equipos chinos en el ecosistema de código abierto. Un responsable de Hugging Face señaló que las contribuciones de ambos equipos proporcionan recursos eficientes a desarrolladores de todo el mundo. El CEO de NVIDIA, Jensen Huang, también elogió el equilibrio entre rendimiento y costo que están redefiniendo el panorama del AI. En el futuro, Qwen planea explorar tecnologías multimodales, mientras que DeepSeek lanzará el modelo R2 para seguir impulsando la innovación en IA.
Gráfico de calor de lanzamientos de modelos de Hugging Face: https://huggingface.co/spaces/cfahlgren1/model-release-heatmap