Boletín diario de IA: MiniMax-M1 se ha liberado como código abierto; Moonshot lanza un nuevo modelo llamado Kimi-Dev-72B; La versión actualizada de Qwen3 de Alibaba está adaptada para la arquitectura MLX de Apple

Bienvenido al programa de noticias de IA! Aquí encontrarás una guía para explorar el mundo de la inteligencia artificial cada día. Cada día te presentamos las noticias más destacadas del campo de la IA, centrándonos en los desarrolladores y ayudándote a comprender las tendencias tecnológicas y las aplicaciones innovadoras de IA.

Nuevos productos de IA haz clic para conocer más: https://top.aibase.com/

1. Moon's Dark Side lanza un nuevo modelo de código abierto Kimi-Dev-72B, rompiendo récords en pruebas de benchmarks de programación

Moon's Dark Side ha lanzado un nuevo modelo de código abierto Kimi-Dev-72B, especializado en tareas de ingeniería de software. En las pruebas SWE-bench Verified obtuvo el mejor puntaje, superando a DeepSeek-R1 con 7200 millones de parámetros, demostrando su capacidad en el campo de la programación.

[Resumen AiBase:]

🚀 El modelo Kimi-Dev-72B con solo 7200 millones de parámetros obtuvo un 60.4% en las pruebas SWE-bench Verified, convirtiéndose en un nuevo estándar en modelos de código abierto.

🔍 Este modelo combina funciones como BugFixer y TestWriter para garantizar la calidad y corrección del código, mejorando el rendimiento mediante mecanismos de autoaprendizaje.

🌟 En el futuro planean integrarlo profundamente con herramientas de desarrollo populares y lanzar versiones más avanzadas.

2. MiniMax-M1 se abre al público ¡con capacidad de inferencia de 1M contextos!

MiniMax-M1 ha llamado la atención por su capacidad de inferencia de contexto largo, bajo costo de entrenamiento y su naturaleza de código abierto, destacándose entre otros modelos de código abierto.

[Resumen AiBase:]

Contexto de entrada de hasta 1M y salida de 80k, superando a GPT-4o, ideal para análisis de documentos complejos y diálogos multirrounder.

Costo de entrenamiento solo 530 mil dólares, logrado gracias a la arquitectura MoE y el algoritmo CISPO para inferencias eficientes y económicas.

Publicado en Hugging Face, soporta presupuestos de pensamiento de 40k y 80k, con un rendimiento comparable a los mejores modelos comerciales.

3. El modelo de canto de Tencent LeVo llega, comparable a Suno 4.5 y compatible con clonación de tonos sin muestras previas

El modelo LeVo de la división de IA de Tencent ha causado sensación por sus capacidades de clonación de tonos, generación de pistas separadas y alta fidelidad musical. Comparado con Suno4.5, destaca en varios indicadores clave y soporta la clonación de tonos sin muestras previas y la generación de pistas separadas, mostrando un avance revolucionario.

[Resumen AiBase:]

🌟 Soporta la clonación de tonos sin muestras previas, solo necesita 3 segundos de audio para copiar exactamente el tono, reduciendo significativamente la barrera para la creación musical.

🎵 Proporciona un modo de generación de pistas separadas que permite separar voz e instrumentos, ofreciendo mayor flexibilidad para la producción musical profesional.

🌐 Publicado en formato de código abierto, promoviendo el desarrollo de comunidades globales de creación musical y elevando la influencia internacional de la tecnología china de IA.

Enlace detallado: https://levo-demo.github.io/

4. Alibaba lanza la versión actualizada de Qwen3, adaptada a la arquitectura MLX de Apple

Estoy muy optimista sobre esta colaboración entre Alibaba y Apple. La versión actualizada de Qwen3 no solo soporta más idiomas, sino que también mejora el rendimiento y la capacidad de inferencia, marcando un paso importante en el desarrollo de la inteligencia de Apple en el mercado chino.

[Resumen AiBase:]

🌟 Alibaba lanza la versión actualizada de Qwen3, compatible con la arquitectura MLX de Apple, impulsando la llegada de la inteligencia de Apple en China.

📱 La nueva versión de Qwen3 soporta 119 idiomas y tiene un rendimiento mejorado y habilidades de inferencia mixta.

🚀 La inteligencia de Apple aún no ha llegado a China y podría preverse en la versión de prueba pública iOS18.6.

5. La versión para PC y web de DouBao introduce la función de 'Podcast de IA'

DouBao ha lanzado una nueva función llamada 'Podcast de IA', que genera podcasts de doble persona naturales a partir del cargado de PDF o enlaces. Esto revoluciona la manera de recibir información.

[Resumen AiBase:]

🌟 Solo sube un PDF o enlace y obtendrás rápidamente un podcast de doble persona natural y fluido.

🏃‍♂️ Ideal para trabajos, estudios y otras escenas, aprovecha los momentos libres para obtener información de manera eficiente.

🎙️ El efecto vocal es realista, sin sensación de máquina, proporcionando una experiencia auditiva inmersiva.

6. La aplicación Quark lanza 'Quark Teacher', con capacidades de tutoría personalizada de IA

La aplicación Quark ha lanzado un nuevo producto educativo llamado 'Quark Teacher'. Esta función de asistente de IA es poderosa, puede explicar problemas, corregir tareas, generar preguntas y buscar exámenes, especialmente destacada en la resolución de problemas de matemáticas y física. Además, tiene la capacidad de enseñar según las características individuales de los estudiantes, proporcionando tutorías personalizadas analizando los datos de aprendizaje de los estudiantes.

[Resumen AiBase:]

✨ Combina múltiples funciones educativas en una sola, como explicar problemas, corregir tareas, generar preguntas y buscar exámenes, soportando análisis profundos de problemas de matemáticas y física.

🎯 Puede proporcionar tutorías personalizadas según las características de los estudiantes, simulando el razonamiento de un profesor humano, ayudando a los estudiantes a comprender y mejorar su rendimiento académico.

📚 Posee una extensa base de datos con recursos como exámenes profesionales y exámenes reales de colegios de renombre, satisfaciendo diversas necesidades de aprendizaje.

7. El nuevo modelo multi-modal OmniFlow de Panasonic permite la libre transición entre texto, imagen y audio

Me encanta mucho el modelo multi-modal OmniFlow. No solo puede convertir fácilmente entre texto, imagen y audio, sino que además permite a los usuarios personalizar los resultados generados según sus necesidades, lo que mejora enormemente la flexibilidad y eficiencia de las operaciones.

[Resumen AiBase:]

🌟 OmniFlow soporta la conversión eficiente entre texto, imagen y audio, ofreciendo una experiencia multi-modal completamente nueva.

⚙️ Diseño modular, cada componente preentrenado de forma independiente, aumentando la eficiencia en el uso de recursos y optimizando el entrenamiento.

🎯 Introduce un mecanismo de orientación multi-modal, permitiendo a los usuarios controlar precisamente el proceso de generación, satisfaciendo diversas demandas.

8. TikTok lanza nuevas herramientas de creación de videos basadas en IA: imágenes a videos, texto a videos

TikTok ha lanzado tres herramientas de creación de videos basadas en IA, incluidas 'Imagen a Video', 'Texto a Video' y 'Showcase Products'. Estas herramientas simplifican el proceso de creación de contenido publicitario para marcas. Están integradas en el Symphony Creative Studio y han colaborado con Adobe Express y WPP Open para mejorar la eficiencia de los anunciantes.

[Resumen AiBase:]

✨ La función de Imagen a Video convierte imágenes estáticas en videos dinámicos, solo necesitas subir una imagen y agregar una pista de texto para obtener múltiples opciones de video generadas por IA.

📝 La función de Texto a Video no requiere imágenes ni plantillas, solo texto para crear videos, ayudando a los anunciantes a probar rápidamente y perfeccionar ideas creativas.

🛍️ La herramienta Showcase Products fusiona imágenes de productos y avatares digitales, creando experiencias publicitarias inmersivas y potenciando estilos de contenido original.

9. ZEEKR y ByteDance Engine se asocian para potenciar la nueva experiencia de cabina inteligente con el modelo DouBao

ZEEKR Automotive y ByteDance Engine han colaborado para integrar el modelo DouBao en la nueva versión del sistema operativo ZEEKR AI OS, mejorando la capacidad de servicios de cabina inteligente y optimizando la experiencia personalizada.

[Resumen AiBase:]

El modelo DouBao se integra en la cabina inteligente de ZEEKR, ofreciendo recomendaciones precisas y servicios personalizados.

El asistente de voz inteligente de ZEEKR, Eva, ahora soporta la transición sin interrupción desde la interacción de voz tradicional a los servicios de modelos de lenguaje grandes.

El vehículo número 500,000 de ZEEKR, el 009, se ha producido, estableciendo un nuevo récord para los vehículos eléctricos de lujo.

10. Nueva ruptura en los modelos grandes: Meta Llama 3.1 puede recordar el 42% del contenido de Harry Potter

Estudios de universidades como Stanford han demostrado que el modelo Llama3.170B de Meta ha mostrado un excelente desempeño en memoria de texto, especialmente destacándose en libros populares como Harry Potter.

[Resumen AiBase:]

📚 El modelo Llama3.170B puede recordar el 42% del contenido de Harry Potter, superando al Llama165B que solo alcanza el 4.4%.

🔍 El estudio utiliza la base de datos Books3 y prueba la memoria del modelo marcando párrafos.

🌟 Los resultados en libros populares son mejores, mostrando el progreso de la IA en la comprensión y procesamiento de texto.

11. La función de tareas programadas de Grok de xAI ya está disponible: seguimiento programado de temas populares, eficiencia superior a ChatGPT

El asistente de IA Grok de xAI ha lanzado una nueva función de tareas programadas (Tasks), que automatiza consultas y notificaciones externas, proporcionando una experiencia eficiente y conveniente para obtener información.

[Resumen AiBase:]

🌟 Soporta varias frecuencias de tareas, desde tareas inmediatas hasta seguimientos a largo plazo, satisfaciendo diversas necesidades.

📧 Ofrece funciones de notificación externa, como envío por correo electrónico, enviando resultados directamente al usuario, mejorando la comodidad de uso.

🏆 Los usuarios de SuperGrok tienen acceso a mayores cuotas y disfrutan prioridad en la experiencia de funciones avanzadas como DeepSearch y Big Brain Mode.

12. Gemini 2.5 Pro actualizará próximamente la función Deep Think

Como asistente de IA, estoy muy emocionado por la nueva función Deep Think de Gemini 2.5 Pro. Esta función no solo mejora la capacidad de razonamiento del AI en tareas complejas, sino que también hace importantes mejoras en la experiencia del usuario y la seguridad. La introducción de Deep Think me hace ver el gran potencial del AI en aplicaciones profesionales.

[Resumen AiBase:]

💎 La función Deep Think mejora significativamente el rendimiento en tareas complejas a través de la推理 de múltiples hilos, destacándose especialmente en tareas matemáticas, de programación y multimodales.

🌐 Los usuarios pueden cambiar a modo Deep Think de manera intuitiva a través de la interfaz web, y la función se irá abriendo gradualmente a más usuarios.

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

Boletín diario de IA: MiniMax-M1 se ha liberado como código abierto; Moonshot lanza un nuevo modelo llamado Kimi-Dev-72B; La versión actualizada de Qwen3 de Alibaba está adaptada para la arquitectura MLX de Apple

站长之家

Este artículo proviene de AIbase Daily