Bienvenido a la sección "AI Daily"! Aquí encontrarás una guía diaria para explorar el mundo de la inteligencia artificial. Cada día, te presentamos las noticias más destacadas en el campo de la IA, enfocándonos en los desarrolladores para que puedas comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de la IA.

Productos de IA recientes Haga clic para más información:https://app.aibase.com/zh

1. DINGTALK celebra su décimo aniversario con la lanzamiento de la versión 8.0, presentando una nueva forma de oficina inteligente: DINGTALK ONE

DingTalk lanzó la versión 8.0 durante su décimo aniversario, presentando una nueva forma de aplicación de oficina inteligente: DINGTALK ONE. Este producto permite la interacción entre humanos y IA mediante conversaciones de lenguaje natural, simplificando procesos laborales complejos y reduciendo la barrera de uso. Además, DingTalk demostró su posición en el mercado y el reconocimiento de los usuarios, incluyendo datos como el número de organizaciones empresariales, el número de organizaciones pagadas y la cantidad de aplicaciones de IA.

image.png

【Resumen de AiBase:】

✨ DingTalk lanzó la versión 8.0, presentando una nueva forma de oficina inteligente llamada DINGTALK ONE.

🤖 DINGTALK ONE permite la interacción entre humanos y IA mediante conversaciones de lenguaje natural, simplificando los procesos laborales.

📊 DingTalk demostró su posición en el mercado y el reconocimiento de los usuarios, incluyendo datos como el número de organizaciones empresariales y la cantidad de aplicaciones de IA.

2. Alibaba libera Mobile-Agent 3: una poderosa familia de agentes GUI

El equipo X-PLUG lanzó Mobile-Agent-v3, un marco de múltiples agentes multiplataforma con funciones poderosas y rendimiento optimizado, adecuado para tareas de automatización GUI.

image.png

【Resumen de AiBase:】

🧠 Mobile-Agent-v3 está basado en GUI-Owl, posee capacidades poderosas de planificación, gestión del progreso, reflexión y memoria.

⚙️ Optimizó la capacidad de manejo de errores y reflexión, asegurando operaciones eficientes incluso en condiciones de interferencia.

📚 Ofrece informes técnicos, videos de demostración y bibliotecas de código, facilitando que los desarrolladores exploren su potencial.

Enlace detallado: https://github.com/X-PLUG/MobileAgent

3. El podcast de IA de WeChat sorprende al público: dos personas hablan noticias, ¿el locutor tradicional quedará en el desempleo?

WeChat está probando una función llamada podcast de IA, que presenta noticias en forma de diálogo entre dos personas, brindando a los usuarios una experiencia inmersiva de información. Esta función se basa en contenido noticioso y utiliza tecnología de IA para convertir texto en un formato de transmisión natural y fluido, cambiando así el modo tradicional de consumir noticias.

image.png

【Resumen de AiBase:】

✨ WeChat lanzó una función de podcast de IA, que presenta noticias en forma de diálogo entre dos personas, mejorando la experiencia del usuario.

💡 El podcast de IA se basa en información de medios autorizados y gobiernos locales, asegurando la precisión y confiabilidad del contenido.

🚀 En el futuro, podría extenderse a escenarios como lectura de artículos largos y revisión de registros de chat, redefiniendo la forma de obtener información.

4. DingTalk lanza su primer dispositivo de IA: el producto de grabación de voz DingTalk A1

El CEO de DingTalk, Chen Hang, presentó en la conferencia de celebración de su décimo aniversario el primer producto de hardware de IA de DingTalk: DingTalk A1. Este dispositivo, con un espesor de solo 3,8 milímetros, puede ayudar a los usuarios a grabar claramente contenido de voz y ofrecer servicios de transcripción con alta precisión. Además, incluye 36 plantillas de agentes para trabajo y vida cotidiana, mejorando la eficiencia en la toma de notas de reuniones y resúmenes de trabajo.

image.png

【Resumen de AiBase:】

🔋 DingTalk A1 es un dispositivo de hardware de IA con un espesor de solo 3,8 mm, fácil de transportar.

🎙️ Soporta grabación clara dentro de 8 metros y ofrece 10.000 minutos de servicio gratuito de transcripción con una precisión del 97%.

🤖 Incluye 36 plantillas de agentes para trabajo y vida cotidiana, mejorando la eficiencia laboral.

5. Siri de Apple podría incorporar el modelo de gran tamaño Gemini de Google, fortaleciendo sus capacidades de IA

Apple está explorando una colaboración con Google, planeando introducir una versión personalizada del modelo de gran tamaño Gemini para la próxima versión actualizada de Siri, con el fin de mejorar las capacidades de IA de su asistente de voz. Este movimiento refleja la presión competitiva que enfrenta Apple en el campo de la IA y busca compensar las deficiencias de Siri a través de la colaboración con Google, ofreciendo a los usuarios una experiencia de interacción más inteligente y eficiente.

image.png

【Resumen de AiBase:】

🍎 Apple planea colaborar con Google para integrar el modelo de gran tamaño Gemini en Siri.

🤖 El objetivo es mejorar las capacidades de IA de Siri y mejorar la experiencia de interacción del usuario.

📈 Esta colaboración podría tener un impacto profundo en la estructura del mercado de asistentes de IA.

6. Apple lanza una versión adaptada del modelo SlowFast-LLaVA: rendimiento en la comprensión de videos largos superior al de modelos grandes

La versión adaptada del modelo SlowFast-LLaVA lanzada por el equipo de investigación de Apple mostró un buen rendimiento en tareas de análisis de videos largos, incluso superando a modelos con mayor número de parámetros. Este modelo utiliza una arquitectura de doble flujo, resolviendo eficazmente problemas de redundancia de información y desbordamiento de ventana de contexto en el modo tradicional de procesamiento por cuadro, proporcionando una solución eficiente para el análisis de contenido de videos largos.

image.png

【Resumen de AiBase:】

🔥 La ventaja principal radica en la arquitectura de doble flujo, optimizando la eficiencia del procesamiento de video.

📈 Obtuvo un buen rendimiento en la prueba de benchmark LongVideoBench, alcanzando 56,6 puntos con una versión de 1.000 millones de parámetros.

🔧 El modelo se entrenó en conjuntos de datos públicos y está abierto, ofreciendo nuevas ideas para la comunidad de IA.

7. Meta adquiere licencia de Midjourney ¡Zuckerberg avanza en la carrera de armas de IA!

Meta alcanzó un acuerdo de licencia tecnológica con Midjourney, fortaleciendo así su competitividad en el campo de generación de imágenes de IA. Esta colaboración representa un paso importante en la estrategia de Meta en el ámbito de la IA, al mismo tiempo que refleja la intensa competencia en la industria de la IA.

image.png

【Resumen de AiBase:】

🔥 Meta alcanzó un acuerdo de licencia tecnológica con Midjourney, mejorando sus capacidades de generación de imágenes de IA.

💡 Zuckerbergs aceleró la obtención de talento e información mediante estrategias de salarios altos e inversiones.

⚖️ Midjourney enfrenta desafíos legales, pero sigue operando de forma independiente.

8. Google Drive mejora significativamente su edición de videos: Vids AI herramienta de edición de videos directa, reduciendo aún más la barrera de creación de videos

Google añadió un botón de edición rápida de videos Vids en Google Drive, permitiendo a los usuarios editar videos de manera más conveniente. Esta función no solo simplifica el proceso de operación, sino que también reduce la barrera de producción de videos, mejorando la experiencia de los usuarios de Workspace.

image.png

【Resumen de AiBase:】

🚀 Google añadió un botón de edición rápida de videos Vids a Google Drive, mejorando la eficiencia de edición de videos.

💡 Vids cuenta con funciones impulsadas por IA, como escritura automática de guiones y reorganización inteligente de fragmentos, simplificando la producción de videos.

🌐 Google impulsa la renovación de herramientas de productividad integrando herramientas de IA en las actividades cotidianas.

9. Quark publica un informe técnico sobre el modelo de salud grande, revelando los detalles técnicos del "médico jefe" de IA

El modelo de salud grande de Quark aprobó las pruebas escritas de 12 materias principales en China, convirtiéndose en el primer modelo grande en completar este desafío en el país. El modelo mostró un excelente rendimiento en tareas de razonamiento médico complejo, mejorando su rendimiento mediante datos médicos de alta calidad y técnicas de aprendizaje por refuerzo.

image.png

【Resumen de AiBase:】

✨ El modelo de salud grande de Quark aprobó las pruebas escritas de médicos jefes, demostrando una alta capacidad profesional.

🧠 Se utilizan tres tipos de datos médicos para entrenar, mejorando la precisión y la capacidad de razonamiento del modelo.

🚀 Se introdujo una etapa de aprendizaje por refuerzo, optimizando la calidad y la conformidad de las salidas del modelo.

Enlace detallado: https://arxiv.org/pdf/2508.11894 https://github.com/Quark-Medical/QuarkMed/blob/main/report/QuarkMed_Technical_Report.pdf

10. La fiebre mundial de dibujar peces! Millones de internautas se obsesionan con este juego de IA, dibujos simples se convierten en peces vivos

El artículo explora cómo el juego de IA Draw A Fish logró un éxito rápido a nivel mundial gracias a su diseño minimalista y mecanismos de interacción social, mostrando la belleza de la combinación de tecnología de IA y creatividad humana.

image.png

【Resumen de AiBase:】

🐟 La tecnología de IA transforma dibujos sencillos en peces virtuales dinámicos, ofreciendo una experiencia creativa única.

🎮 El juego tiene operaciones simples, no requiere registro para participar, atrayendo a muchos usuarios que se sumergen en él.

🌐 El mecanismo de interacción social estimuló la pasión creativa de jugadores globales, formando un espacio de exhibición creativa.