Bienvenido al programa de 【Noticias de IA】! Aquí es donde puedes explorar diariamente el mundo de la inteligencia artificial. Cada día te presentamos los contenidos más destacados del campo de la IA, centrándonos en desarrolladores para ayudarte a comprender las tendencias tecnológicas e investigar aplicaciones innovadoras de IA.
Productos de IA frescos ¡Haz clic para conocerlos!: https://top.aibase.com/
1. Alibaba lanza Wan2.1-VACE de Tongyi Wanxiang como el primer modelo unificado de edición de video abierto.
Tongyi Wanxiang anunció la apertura de VACE, que soporta múltiples resoluciones y tareas, proporcionando una experiencia de creación de videos integral. A través de un mecanismo de entrada multimodal, se puede realizar una edición eficiente y flexible de videos.
【Resumen de AiBase:】
✨ Soporta múltiples tareas como generación de videos desde texto, generación basada en imágenes, edición local y extensión de videos, mejorando la eficiencia de la creación.
🌟 Capacidad controlable avanzada de reescritura basada en posturas humanas, flujo de movimiento y otras funciones de control para generar contenido, con soporte para referencias de sujetos y fondos.
🔧 Se introduce la unidad condicional de video (VCU), unificando entradas multimodales, permitiendo la combinación libre y edición flexible de múltiples tareas.
Enlace detallado: https://github.com/Wan-Video/Wan2.1
2. OpenAI actualiza ChatGPT: Introduce oficialmente GPT-4.1 con capacidad de codificación muy potente.
OpenAI lanzó GPT-4.1 y su versión ligera GPT-4.1 mini, que mejora significativamente la capacidad de codificación y la experiencia de ejecución de instrucciones, además de optimizar la experiencia del usuario y el soporte multimodal, consolidando así su liderazgo en el campo de la IA.
【Resumen de AiBase:】
🚀 GPT-4.1 tiene una capacidad de codificación poderosa, procesando demandas de programación complejas de manera más eficiente y con mayor velocidad, ideal para desarrolladores y escenarios de procesamiento de instrucciones.
🌐 GPT-4.1 mini es ligero y eficiente, funcionando fluidamente incluso en dispositivos con recursos limitados, proporcionando amplio acceso tanto para usuarios gratuitos como pagados.
🌟 ChatGPT añade nuevas funciones como copiar texto con mantener presionado, copiar tablas y transmisión en tiempo real, mejorando significativamente la experiencia del usuario.
3. Stability AI lanza un modelo de texto a audio ultraligero de 341 millones de parámetros, que puede ejecutarse localmente en teléfonos móviles y generar audio en solo 8 segundos!
Stability AI ha lanzado un modelo llamado 'Generación Rápida de Audio desde Texto con Aceleración Post-Entrenamiento Adversaria', con solo 341 millones de parámetros. Sin embargo, puede generar 12 segundos de audio en 75 milisegundos en una GPU H100 y completar la misma tarea en 7 segundos en un procesador móvil, mostrando un rendimiento impresionante y versatilidad.
【Resumen de AiBase:】
⚡️ El método ARC de post-entrenamiento no se basa en distilación, mejorando la velocidad y calidad de generación del modelo.
📱 Diseño ultraligero para dispositivos móviles, permitiendo su ejecución local y mejorando la experiencia de aplicaciones creativas móviles.
💫 Función de transferencia de estilo de audio, inspirando más ideas de creación.
Enlace detallado: https://arxiv.org/pdf/2505.08175
4. Poe reporta: Los modelos de video generados por Lingkling ocupan aproximadamente el 30% de la cuota, liderando a Runway.
Un informe sobre las tendencias de uso de modelos de IA en la primavera de 2025 mostró que varios modelos de generación de video de Lingkling de Kuaishou destacaron en el campo de la generación de video desde texto, ocupando un 30% de la cuota de mercado. Además, el modelo Lingkling 2.0 representó el 21% de las utilizaciones tres semanas después de su lanzamiento. Desde su debut en junio del año pasado, el número total de usuarios globales superó los 22 millones, con un aumento de 25 veces en usuarios activos mensuales y un aumento significativo en la cantidad de videos y fotos generados.
【Resumen de AiBase:】
🌟 Los modelos grandes de Lingkling ocupan un 30% de la cuota en el campo de la generación de video desde texto, liderando a competidores como Runway.
📈 El modelo Lingkling 2.0 ocupó el 21% de la cuota de generación de video tres semanas después de su lanzamiento.
👥 Los usuarios globales de Lingkling AI superan los 22 millones, con un aumento de 25 veces en los usuarios activos mensuales y un incremento significativo en la cantidad de videos y fotos generados.
5. El equipo de Microsoft WizardLM se une al equipo "Hunyuan" de Tencent, posiblemente integrándose en el sistema de investigación de modelos grandes.
El equipo de Inteligencia Artificial de Microsoft WizardLM se incorporó al equipo "Hunyuan" de Tencent, marcando un avance adicional de Tencent en el campo de los modelos grandes. Este equipo no solo trajo múltiples avances tecnológicos, sino que también demostró su capacidad de desarrollo mediante la publicación de modelos abiertos.
【Resumen de AiBase:】
✨ El equipo WizardLM, anteriormente perteneciente a Microsoft, se unió al equipo Hunyuan de Tencent, fortaleciendo la competitividad de Tencent en el campo de los modelos grandes.
🚀 El modelo Hunyuan-TurboS0416 usa por primera vez el nombre "Hunyuan", simbolizando la integración profunda del equipo con Tencent.
💼 Tencent planea aumentar significativamente sus inversiones en IA, con el objetivo de ocupar una posición más dominante en la competencia global de IA.
6. Tencent anuncia el lanzamiento de la versión 2.0 de Hunyuan Image el 16 de mayo.
El equipo de modelos grandes Hunyuan de Tencent anunció que la versión 2.0 de Hunyuan Image será lanzada el 16 de mayo, marcando un importante avance en el campo de la visión artificial de Tencent, con el concepto central de 'más inteligente, más abierto, más chino'.
【Resumen de AiBase:】
🌟 La versión 2.0 de Hunyuan Image será lanzada el 16 de mayo, lo que representa otro importante avance en el campo de la visión artificial de Tencent.
🌐 Las nuevas herramientas destacan la idea de 'más inteligente, más abierto, más chino', ayudando a creadores y empresas a entrar en una nueva era de producción visual impulsada por IA.
🚀 Después del último rediseño del modelo grande Hunyuan el año pasado, Tencent vuelve a mostrar su capacidad de innovación continua en el campo de la inteligencia artificial.
7. Shanghái lanza el consorcio ecológico de identificación de IA, con Xiaohongshu y MiniMax entre los miembros fundadores.
Este artículo describe la creación del consorcio ecológico de identificación de IA en Shanghái, que tiene como objetivo promover el desarrollo de tecnología de identificación en el campo de la IA, mejorar la transparencia y seguridad del contenido generado y establecer una base sólida para construir un entorno de IA confiable a través de la interpretación de políticas y la cooperación empresarial.
【Resumen de AiBase:】
🌟 El consorcio está guiado por la Oficina de Informática de la Comisión Municipal de Internet de Shanghái, reuniendo varias empresas notables con el objetivo de mejorar la transparencia y seguridad del contenido generado por IA.
🔍 El Centro Nacional de Emergencia de Internet y el Instituto de Estándares Electrónicos Chinos interpretan políticas relevantes, enfatizando la combinación de reglas internacionales y características chinas.
🤝 Xiaohongshu, MiniMax y otras empresas participan en la práctica de identificación, explorando diversas soluciones de identificación de contenido y acumulando experiencia en gobernanza.
8. Lightricks lanza el modelo refinado LTX-Video-13B! ¡Genera videos de alta definición en 10 segundos, con un salto doble en velocidad y calidad!
La empresa israelí Lightricks lanzó el modelo de generación de video de IA LTX-Video-13B refinado, que se basa en 13 mil millones de parámetros y combina tecnología de renderizado multiescalas y optimización cuantitativa eficiente, aumentando la velocidad de generación de video a menos de 10 segundos mientras mantiene una salida de alta calidad.
【Resumen de AiBase:】
🚀 Utiliza tecnología de renderizado multiescalas, generando videos de alta definición en menos de 10 segundos, una mejora de más de 5 veces en la velocidad.
🌍 Modelo abierto, compatible con dispositivos con bajas capacidades gráficas, reduciendo el costo de producción de video de IA.
🌟 La velocidad de generación aumenta 30 veces, equiparable a producciones cinematográficas profesionales, remodelando el ecosistema de creación de contenido.
Enlace detallado: https://github.com/Lightricks/LTX-Video
9. Google AlphaEvolve se lanza! Gemini auténtica IA autoevolutiva resuelve problemas matemáticos complejos, optimiza chips y centros de datos, y acelera el entrenamiento en un 32.5%.
AlphaEvolve, lanzado por DeepMind de Google, es un agente de codificación de IA que combina el modelo de lenguaje Gemini y algoritmos de evolución, mostrando capacidades poderosas de autooptimización en varios campos, incluida la asignación de centros de datos, diseño de chips, entrenamiento de IA y matemáticas avanzadas.
【Resumen de AiBase:】
🌟 Gemini combinado con algoritmos de evolución, resolviendo problemas complejos como la optimización de chips y matemáticas avanzadas.
🚀 AlphaEvolve optimiza la asignación de centros de datos, recuperando un 0.7% de la capacidad global de cómputo, ahorrando costos operativos.
🔍 Mejora la eficiencia del entrenamiento de IA, aumentando la velocidad de entrenamiento del modelo Gemini en un 32.5%, mostrando una fuerte capacidad de autooptimización.
10. El complemento del navegador Yuanbao de Tencent llega a la versión de prueba en Chrome.
El complemento del navegador Yuanbao de Tencent se ha lanzado en la versión de prueba en la plataforma Chrome, proporcionando funciones como una bola flotante, barra lateral permanente y herramienta de barra de herramientas de selección de palabras, mejorando la eficiencia de navegación web y el procesamiento de información.
【Resumen de AiBase:】
✨ La función de bola flotante permite traducir y resumir automáticamente el contenido de la página web con un solo clic, cruzando barreras lingüísticas y ahorrando tiempo de lectura.
💬 La barra lateral permanente puede responder preguntas eficientemente, soportando capturas de pantalla para preguntas, aumentando significativamente la eficiencia de obtención de información.
🔍 La barra de herramientas de selección de palabras realiza búsquedas o traducciones instantáneas tras seleccionar texto, facilitando el procesamiento de información.
Enlace detallado: https://yuanbao.tencent.com/download