Bienvenido al programa "AI Daily"! Aquí es tu guía diaria para explorar el mundo de la inteligencia artificial. Cada día te presentamos los temas más destacados en el campo de la IA, enfocándonos en desarrolladores y ayudándote a comprender las tendencias tecnológicas y conocer aplicaciones innovadoras de productos de IA.

Productos de IA recientes Haga clic para obtener más información:https://app.aibase.com/zh

1. Jiemeng AI lanza una función inteligente de múltiples cuadros! Soporta hasta 10 imágenes, genera un largo plano secuencia en un solo clic

El artículo presenta la función inteligente de múltiples cuadros lanzada por Jiemeng AI, que mediante la carga de hasta 10 imágenes clave, puede generar un video de 54 segundos con una secuencia continua. Esta tecnología revolucionaria simplifica el proceso de creación de videos, reduce la barrera de entrada y mejora la calidad visual y fluidez del video.

image.png

【Resumen de AiBase:】

🎬 Simplificación de la producción de videos: Los usuarios simplemente necesitan cargar 10 imágenes para generar un video de 54 segundos con una secuencia larga.

⚡ Movimiento fluido: La IA puede responder con precisión a instrucciones complejas y lograr efectos visuales avanzados.

🌟 Transiciones naturales: Las transiciones de imagen son naturales y elegantes, mejorando la experiencia de visualización del espectador.

2. La función de cuadro inicial y final de Keling AI se actualiza significativamente! El rendimiento del modelo 2.1 aumenta un 235%, entrando en una era de control preciso en la creación de videos

El artículo describe en detalle la función de cuadro inicial y final del modelo 2.1 de Keling AI, que gracias a un aumento del 235% en el rendimiento, hace que la generación de videos de IA sea más precisa y controlable. El artículo analiza el impacto profundo de esta innovación en publicidad, producción cinematográfica, creación de cortos y animación desde perspectivas como los avances técnicos, aplicaciones prácticas y el impacto en la industria.

image.png

【Resumen de AiBase:】

🎥 La función de cuadro inicial y final permite a los creadores especificar con precisión las imágenes de inicio y fin del video, mejorando el control sobre la generación del video.

🚀 El modelo 2.1 logra un salto cualitativo en arquitectura de algoritmos y datos de entrenamiento, trayendo un salto en el rendimiento.

💡 La innovación tecnológica impulsa la generación de videos de IA hacia una era de control preciso, ofreciendo nuevas oportunidades a varias industrias.

3. DINGTANG y el Laboratorio Tongyi lanzan Fun-ASR, un nuevo modelo de reconocimiento de voz de gran escala

DingTalk y el Laboratorio Tongyi han lanzado un nuevo modelo de reconocimiento de voz de gran escala llamado Fun-ASR, que tiene ventajas como la eficiente conversión de señales de voz complejas, la identificación precisa de términos industriales, y el soporte para el reconocimiento de múltiples idiomas y acentos. Además, Fun-ASR ofrece servicios de entrenamiento personalizado de modelos, satisfaciendo las necesidades individuales de las empresas, lo que marca un avance importante en la ruta de herramientas de colaboración empresarial inteligentes de DingTalk.

image.png

【Resumen de AiBase:】

🧠 Fun-ASR puede convertir eficientemente señales de voz complejas y reconocer con precisión términos industriales.

🌍 Soporta el reconocimiento de múltiples idiomas y acentos, ampliando las aplicaciones.

🛠️ Ofrece servicios de entrenamiento personalizado de modelos, satisfaciendo las necesidades individuales de las empresas.

4. La versión china de CodeBuddy IDE de Tencent inicia su prueba pública, integrando DeepSeek V3.1

La versión china de CodeBuddy IDE de Tencent ha iniciado oficialmente su prueba pública, apoyando varios modelos avanzados como DeepSeek-V3.1-Think, logrando así una experiencia de programación automatizada integral desde la demanda hasta la implementación.

image.png

【Resumen de AiBase:】

✅ CodeBuddy IDE es la primera plataforma integral de IA en China que admite DeepSeek V3.1.

🧠 DeepSeek-V3.1-Think destaca en habilidades de programación, obteniendo una alta puntuación del 71.6%.

🚀 Incluye herramientas como Tencent Cloud EdgeOne Pages, ayudando a los desarrolladores a construir y desplegar aplicaciones rápidamente.

5. Se lanza Vercel AI Gateway! Llama a cien modelos de IA con un solo clic, crea aplicaciones inteligentes sin barreras

El lanzamiento de Vercel AI Gateway proporciona a los desarrolladores una plataforma eficiente y conveniente para acceder a modelos de IA, resolviendo los complejos problemas de gestión de múltiples modelos y proveedores. Sus puntos destacados incluyen el acceso único a diversos modelos de IA, costo cero adicional, alto rendimiento y confiabilidad, así como una integración sin problemas con SDKs de IA.

image.png

【Resumen de AiBase:】

🧠 Soporta cientos de modelos de IA, cubriendo proveedores principales como OpenAI y Anthropic.

💰 Costo cero adicional, admite la función BYOK, mejorando la flexibilidad y transparencia.

⚡ Alto rendimiento y fiabilidad, con un retardo inferior a 20 milisegundos, asegurando la operación estable de la aplicación.

Enlace detallado: https://vercel.com/blog/ai-gateway-is-now-generally-available

6. Anthropic integra Claude Code en sus planes empresariales para mejorar la capacidad de gobernanza del desarrollo de IA

Anthropic ha integrado Claude Code en sus planes empresariales, mejorando así la capacidad de gobernanza del desarrollo de IA, y también ha lanzado una API de cumplimiento para aumentar el control y la auditoría de la codificación asistida por IA en empresas.

image.png

【Resumen de AiBase:】

🧠 Claude Code se integra en el servicio de suscripción empresarial de Anthropic, convirtiéndose en parte de su conjunto de herramientas de desarrollo.

🔒 La nueva API de cumplimiento proporciona acceso programático para que los líderes de TI y seguridad rastreen el uso y los indicadores de contenido.

📈 Anthropic experimentó un crecimiento significativo en el número de usuarios durante el verano de 2025, lo que llevó a la empresa a lanzar un tablero de monitoreo y límites de uso para gestionar la actividad.

7. Mobile-Agent-v3 de Alibaba aparece repentinamente! Un gran avance en el campo de la automatización GUI

El artículo presenta el tercer marco de inteligencia artificial GUI de Alibaba, Mobile-Agent-v3, y el modelo de capa virtual multimodal de código abierto GUI-Owl, mostrando su desempeño sobresaliente en varios benchmarks autorizados y destacando su gran avance técnico en el campo de la automatización GUI.

image.png

【Resumen de AiBase:】

📱 Mobile-Agent-v3 es un marco multientidad multiplataforma construido sobre GUI-Owl, logrando operaciones sin interrupción entre aplicaciones.

🖼️ GUI-Owl puede comprender con precisión el diseño de la interfaz y convertir instrucciones de lenguaje natural en operaciones en la pantalla.

🌐 El proyecto de código abierto GUI-Owl proporciona a los desarrolladores globales una base para construir soluciones personalizadas, impulsando la innovación tecnológica en la industria.

Enlace detallado: https://github.com/X-PLUG/MobileAgent

8. Alibaba lanza una nueva plataforma de programación Agentic Qoder

La plataforma de programación Qoder de Alibaba mejora significativamente la eficiencia del desarrollo de software mediante su poderosa capacidad de ingeniería de contexto y agentes de IA. Su compatibilidad con la función Repo Wiki y un sistema de memoria a largo plazo le permite a los desarrolladores completar tareas de manera más eficiente y mostrar un desempeño sobresaliente en pruebas reales.

image.png

【Resumen de AiBase:】

🧠 Qoder posee una fuerte capacidad de ingeniería de contexto, permitiendo recuperar rápidamente archivos de código masivos.

🔄 Incorpora un sistema de memoria a largo plazo, que puede completar tareas comunes automáticamente según los hábitos del usuario.

🚀 Nueva función Quest Mode, que transforma requisitos abstractos en especificaciones de diseño detalladas y completa autonomamente las tareas de desarrollo.

Enlace detallado: https://qoder.com

9. El equipo IDEA de Tsinghua lanza GUAVA! Genera un avatar 3D con una sola foto en 0,1 segundos, ¡una ruptura tecnológica que sorprende al mundo!

El marco GUAVA desarrollado por la Universidad de Tsinghua y el Instituto de Economía Digital de la Región de Guangdong-Hong Kong-Macao ha logrado un hito histórico en la generación de avatares 3D. Este marco puede crear un modelo de avatar 3D de alta precisión en 0,1 segundos utilizando solo una foto, mejorando significativamente la eficiencia y realismo, brindando un sólido respaldo técnico para múltiples industrias.

image.png

【Resumen de AiBase:】

🚀 El marco GUAVA puede generar avatares 3D en 0,1 segundos, mejorando significativamente la eficiencia.

🧠 Introduce modelos 3D gaussiana y modelos corporales EHM, logrando efectos altamente realistas.

🌐 Proyecto de código abierto promueve la innovación de desarrolladores globales y fomenta la difusión de la tecnología.

Enlace detallado: https://eastbeanzhang.github.io/GUAVA/

10. Google Search agrega un AI Agent, reserva de restaurantes y servicios personalizados se realizan con un solo clic!

El motor de búsqueda de Google ha agregado una función de AI Agent, ofreciendo a los usuarios una experiencia de búsqueda más inteligente. Esta función puede completar automáticamente la reserva de restaurantes y personalizar los resultados de búsqueda según las preferencias personales, simplificando el proceso de reserva y mejorando la conveniencia. Además, el AI Agent también admite compartir los resultados de búsqueda, facilitando decisiones conjuntas, y en el futuro se expandirá a más aplicaciones.

image.png

【Resumen de AiBase:】

🍽️ La función de AI Agent ayuda a los usuarios a reservar restaurantes fácilmente, satisfaciendo necesidades personalizadas.

👥 Los usuarios pueden compartir resultados de búsqueda, tomar decisiones conjuntas con amigos, mejorando la experiencia interactiva.

🌍 La función ya está disponible en 180 países, y en el futuro se expandirá a más áreas de aplicación.

11. VAST lanza Tripo 3.0! El nuevo rey de la modelización 3D impulsada por IA, con un conjunto de datos de 40 millones de elementos que impresionan al mundo

El artículo presenta la versión Tripo 3.0 lanzada por la empresa VAST, que marca una nueva etapa en la creación de contenido 3D impulsada por IA. El modelo de gran escala de VAST de 3D ya ha servido a más de 3 millones de desarrolladores y es utilizado por más de 700 empresas, demostrando el enorme potencial de la IA en el campo de la modelización 3D.

image.png

【Resumen de AiBase:】

🚀 Tripo 3.0 es un gran avance en la tecnología de modelización 3D impulsada por IA, impulsando cambios en la industria.

📊 VAST posee un conjunto de datos 3D de alta calidad de 40 millones, proporcionando un fuerte respaldo para los modelos de IA.

💼 La elección de más de 700 clientes empresariales demuestra el valor comercial y utilidad de la tecnología de modelización 3D impulsada por IA.