Bienvenido al programa de 【Noticias de IA】! Aquí es donde puedes explorar diariamente el mundo de la inteligencia artificial. Cada día te presentamos las noticias más destacadas del campo de la IA, enfocándonos en desarrolladores para ayudarte a comprender las tendencias tecnológicas e investigar aplicaciones innovadoras de IA.

Nuevos productos de IA Haz clic para conocer más: https://top.aibase.com/

1. ¡Acceso abierto sin código de invitación! La plataforma de inteligencia artificial nativa china Manus abre su registro a todos.

La plataforma de inteligencia artificial Manus recientemente ha abierto el registro de usuarios, sin necesidad de esperar, permitiendo a los usuarios registrarse directamente y recibir recompensas en forma de puntos. Desarrollado por la empresa Monica, este sistema ha ganado popularidad rápidamente gracias a su encanto único como agente de IA general. Manus mejora considerablemente el potencial creativo de los usuarios mediante una innovadora arquitectura de ingeniería que combina pensamiento y acción, abarcando múltiples campos de ejecución de tareas, marcando un cambio en la aplicación de IA.

image.png

【Resumen de AiBase:】

🚀 La plataforma Manus está ahora disponible para el registro, permitiendo a los usuarios realizar tareas gratuitas diarias y recibir recompensas en puntos.

🤖 Manus combina ingeniería innovadora con pensamiento y acción, apoyando la ejecución de tareas complejas.

🌐 Colaborando con el equipo de Tongyi Qwen de Alibaba, explora la aplicación de modelos nacionales y plataformas de computación, mejorando la experiencia del usuario.

2. ¡El primer agente de diseño global Lovart entra en pruebas internas! Una sola oración para lograr el logotipo, video y paquete de marca completo

Lovart AI lanzó el primer agente de diseño global integrando modelos de imágenes, videos y música, revolucionando el flujo tradicional de diseño. Los usuarios pueden realizar diseños automatizados en toda la cadena a través de instrucciones verbales naturales, atrayendo la atención de diseñadores y empresas emergentes. Sus funciones principales incluyen descomposición de tareas, creación de contenido transmedial e inteligente separación de texto e imagen, lo que mejora significativamente la eficiencia del diseño. Lovart ha mostrado un excelente rendimiento durante la fase Beta y se espera que impulse aún más el desarrollo del mercado de herramientas de diseño basadas en IA.

image.png

【Resumen de AiBase:】

🛠️ Lovart AI realiza diseños automatizados en toda la cadena a través de instrucciones verbales naturales, permitiendo a los usuarios completar tareas complejas con una sola oración.

🎥 Soporta la integración de modelos multimodales, permitiendo a los usuarios generar fácilmente contenido de imágenes, videos y música, aumentando la flexibilidad creativa.

🌐 Lovart ha recibido una gran acogida durante la fase Beta, con los usuarios elogiando que mejora la eficiencia del diseño en más de cinco veces, mostrando un enorme potencial en el mercado.

Enlace detallado: https://lovart.ai

3. El Ministerio de Educación define los límites del uso de IA: guías graduales desde la primaria hasta la secundaria, prohibición de copiar respuestas de IA

El Ministerio de Educación ha publicado las "Guías Generales de Educación Popular sobre Inteligencia Artificial (Versión 2025)" y las "Guías de Uso de Inteligencia Generativa para Estudiantes (Versión 2025)", estableciendo normativas claras para el uso de la IA en la educación. Se enfatiza la prohibición de que los estudiantes copien directamente el contenido generado por IA como respuesta a tareas o exámenes, para evitar afectar la capacidad de pensamiento independiente. Además, las guías proponen estrategias graduales según las características de cada etapa educativa, reforzando el papel del docente como guía para asegurar que los estudiantes usen herramientas de IA de manera segura y adecuada.

image.png

【Resumen de AiBase:】

🚫 Prohibir a los estudiantes copiar directamente el contenido generado por IA como respuesta a tareas o exámenes, evitando depender de la IA y debilitando la capacidad de pensamiento independiente.

👩‍🏫 Los docentes deben guiar a los estudiantes en el entrenamiento del pensamiento crítico, analizando las deficiencias lógicas y los sesgos culturales del texto generado por IA.

🔒 Establecer un sistema de lista blanca de herramientas de IA para asegurar que las herramientas de IA utilizadas en la escuela cumplan con los requisitos educativos y sean compatibles con la seguridad de los datos.

4. Construyendo un mundo interactivo controlable a partir de imágenes: Kunlun Weiwei abre Matrix-Game

Kunlun Weiwei Group anunció el 13 de mayo la apertura del modelo Matrix-Game, un modelo avanzado enfocado en la generación de mundos interactivos, marcando un nuevo hito en esta área de tecnología. Matrix-Game no solo es el primer modelo de inteligencia espacial de más de 10 mil millones de parámetros en la industria que se abre al público, sino que también logra una alta calidad de generación y control preciso a través de sus tres componentes principales.

image.png

【Resumen de AiBase:】

🛠️ Matrix-Game es el primer modelo de inteligencia espacial de más de 10 mil millones de parámetros que se abre al público, enfocado en la generación de mundos interactivos, superando el límite técnico actual.

📊 Este modelo evalúa el rendimiento mediante el sistema de puntuación GameWorld Score, cuantificando el rendimiento en cuatro dimensiones: calidad visual y temporal, entre otras, superando los modelos base existentes.

🌍 Matrix-Game tiene la capacidad de generalización en varios escenarios, adaptándose a diferentes terrenos y ambientes, mejorando la experiencia de interacción del usuario.

Enlace detallado: https://matrix-game-homepage.github.io

5. Descargas de Google Gemma AI superan los 150 millones

Google anunció recientemente que las descargas de su conjunto de modelos de inteligencia artificial Gemma han superado los 150 millones, mostrando un avance significativo en el campo de la IA. Gemma es un modelo multimodal capaz de procesar texto e imágenes, soportando más de 100 idiomas, satisfaciendo las necesidades globales de los usuarios. A pesar del número considerable de descargas, sigue siendo inferior a las 1200 millones de descargas de Llama, y ha sido criticado por los desarrolladores debido a términos de licencia complejos.

image.png

【Resumen de AiBase:】

🌟 Superando 150 millones de descargas: El conjunto de modelos de IA Gemma de Google ha atraído la atención de muchos desarrolladores, marcando un avance significativo.

🖼️ Función multimodal: Gemma puede procesar texto e imágenes, satisfaciendo las necesidades globales de los usuarios y soportando más de 100 idiomas.

⚠️ Polémica sobre los términos de licencia: Tanto Gemma como Llama han sido criticados por los términos de licencia complejos, preocupando a los desarrolladores sobre posibles riesgos comerciales.

6. OpenAI lanza función para exportar informes de investigación profundos a PDF

OpenAI ha lanzado una nueva función que permite a los usuarios exportar sus informes de investigación profundos a formato PDF con un solo clic. Esta actualización mejora significativamente la utilidad y la eficiencia de compartir informes, especialmente en entornos empresariales. Los usuarios pueden generar fácilmente documentos profesionales que incluyen citas, tablas e imágenes, mejorando así la toma de decisiones y la comunicación.

image.png

【Resumen de AiBase:】

📝 La nueva función de exportación a PDF permite a los usuarios generar informes de investigación profundos en formato completo con un solo clic, mejorando la eficiencia de la compartición.

🔗 Esta función admite tanto informes nuevos como anteriores, asegurando que los usuarios puedan acceder a sus resultados previos cuando sea necesario, aumentando la utilidad de los informes.

🚀 OpenAI, mediante esta actualización, conecta tecnologías avanzadas de IA con los flujos de trabajo existentes de las empresas, promoviendo la implementación práctica de herramientas de IA.

7. ByteDance lanza el marco unificado DreamO para personalizar imágenes: integrando cambio de vestimenta, cambio de rostro y migración de estilos

ByteDance ha lanzado DreamO en la plataforma Hugging Face, un marco completamente nuevo que integra múltiples funciones de edición de imágenes, marcando un gran avance en la tecnología de edición de imágenes basada en IA. DreamO no solo soporta funciones como cambio de vestimenta, cambio de rostro y migración de estilos, sino que también atrae a desarrolladores a través de su característica de código abierto, promoviendo la innovación en la industria. Su solución integral reduce la barrera de entrada, permitiendo que diseñadores profesionales y usuarios comunes realicen ediciones de imágenes de alta calidad de manera sencilla.

image.png

【Resumen de AiBase:】

✨ DreamO es un marco unificado que integra múltiples funciones como cambio de vestimenta, cambio de rostro y migración de estilos, satisfaciendo diversas necesidades de edición de imágenes.

🔧 Con ajustes de parámetros flexibles, los usuarios pueden realizar ediciones precisas de imágenes fácilmente, reduciendo la barrera de entrada y adaptándose a todos los tipos de usuarios.

🌍 La característica de código abierto de DreamO fomenta la participación de desarrolladores de todo el mundo, promoviendo la innovación y la aplicación en el campo de la edición de imágenes basada en IA.

Enlace detallado: https://github.com/bytedance/DreamO

8. Actualización de la interfaz de Kimi de Moonlit Shadows: optimización de estilo de burbujas, cambiando a presentación de contenido sin bordes

La compañía Moonlit Shadows Technology realizó una importante actualización de la interfaz de su asistente inteligente Kimi, con el objetivo de mejorar la experiencia del usuario y la capacidad de presentación de información. Esta actualización introduce contenedores multimodales, que admiten gráficos K en tiempo real, previsualización HTML y funciones de reproducción de voz, mejorando la interacción entre los usuarios y Kimi. Aunque la nueva interfaz ha provocado cierta nostalgia por la versión anterior entre algunos usuarios, la empresa enfatiza que esto es parte del crecimiento de Kimi y espera que estas actualizaciones lo conviertan en un asistente inteligente aún más poderoso.

image.png

【Resumen de AiBase:】

📈 Kimi admite gráficos K en tiempo real, proporcionando un análisis intuitivo de las tendencias del mercado.

🎤 Nueva función de reproducción de voz, ayudando a los usuarios a seguir la información.

🔧 Los usuarios pueden ver el estado del servicio de Kimi en tiempo real, aumentando la transparencia del sistema.

9. ¡Actualización impresionante de MNN de Alibaba! Soporte de IA multimodal para móviles con Qwen-2.5, ¡texto, imagen y voz cubiertos!

El proyecto MNN de Alibaba lanzó la nueva versión MnnLlmApp, que soporta los modelos Qwen-2.5-Omni-3B y 7B, enormemente mejorando la capacidad de IA multimodal en dispositivos móviles. Esta aplicación soporta varias tareas modales, como la generación y reconocimiento de texto, imágenes y audio, y posee un alto rendimiento y un bajo consumo de recursos, atrayendo la atención de los desarrolladores.

image.png

【Resumen de AiBase:】

🛠️ La nueva versión de MnnLlmApp integra los modelos Qwen-2.5-Omni-3B y 7B, soportando tareas multimodales como texto, imagen y voz, mejorando la capacidad de procesamiento integral.

📱 La aplicación funciona completamente localmente, sin necesidad de conexión a internet, asegurando la privacidad de los datos y demostrando un rendimiento excepcional en la inferencia CPU, superando a productos similares.

🌐 La propiedad de código abierto de MNN y el soporte para modelos populares hacen de él una plataforma ideal para el desarrollo de IA multimodal móvil, impulsando el rápido desarrollo de la industria.

Enlace detallado: https://github.com/alibaba/MNN/blob/master/apps/Android/MnnLlmChat/README.md

10. ChatGPT lanza conector para SharePoint, ¡el análisis empresarial será más eficiente!

ChatGPT ha lanzado recientemente una nueva función que permite a los usuarios acceder a los datos de la empresa a través del conector SharePoint. Esta función está actualmente en prueba y está diseñada específicamente para los usuarios de ChatGPT Plus, Pro y Team. A través de esta integración, ChatGPT puede analizar y resumir el contenido de múltiples sitios SharePoint y proporcionar referencias de origen, ayudando a las empresas a lograr un trabajo más eficiente en la gestión y análisis de datos.