Diario de IA: Jiemeng lanza la función inteligente de múltiples cuadros; Qiling 2.1 actualiza los primeros y últimos cuadros; DingTalk presenta el modelo de reconocimiento de voz Fun-ASR

站长之家

Publicado elNoticias de IA · 17 minutos de lectura · Aug 22, 2025

Bienvenido al programa "AI Daily"! Aquí es tu guía diaria para explorar el mundo de la inteligencia artificial. Cada día te presentamos los temas más destacados en el campo de la IA, enfocándonos en desarrolladores y ayudándote a comprender las tendencias tecnológicas y conocer aplicaciones innovadoras de productos de IA.

Productos de IA recientes Haga clic para obtener más información:https://app.aibase.com/zh

1. Jiemeng AI lanza una función inteligente de múltiples cuadros! Soporta hasta 10 imágenes, genera un largo plano secuencia en un solo clic

El artículo presenta la función inteligente de múltiples cuadros lanzada por Jiemeng AI, que mediante la carga de hasta 10 imágenes clave, puede generar un video de 54 segundos con una secuencia continua. Esta tecnología revolucionaria simplifica el proceso de creación de videos, reduce la barrera de entrada y mejora la calidad visual y fluidez del video.

【Resumen de AiBase:】
🎬 Simplificación de la producción de videos: Los usuarios simplemente necesitan cargar 10 imágenes para generar un video de 54 segundos con una secuencia larga.
⚡ Movimiento fluido: La IA puede responder con precisión a instrucciones complejas y lograr efectos visuales avanzados.
🌟 Transiciones naturales: Las transiciones de imagen son naturales y elegantes, mejorando la experiencia de visualización del espectador.

2. La función de cuadro inicial y final de Keling AI se actualiza significativamente! El rendimiento del modelo 2.1 aumenta un 235%, entrando en una era de control preciso en la creación de videos

El artículo describe en detalle la función de cuadro inicial y final del modelo 2.1 de Keling AI, que gracias a un aumento del 235% en el rendimiento, hace que la generación de videos de IA sea más precisa y controlable. El artículo analiza el impacto profundo de esta innovación en publicidad, producción cinematográfica, creación de cortos y animación desde perspectivas como los avances técnicos, aplicaciones prácticas y el impacto en la industria.

【Resumen de AiBase:】
🎥 La función de cuadro inicial y final permite a los creadores especificar con precisión las imágenes de inicio y fin del video, mejorando el control sobre la generación del video.
🚀 El modelo 2.1 logra un salto cualitativo en arquitectura de algoritmos y datos de entrenamiento, trayendo un salto en el rendimiento.
💡 La innovación tecnológica impulsa la generación de videos de IA hacia una era de control preciso, ofreciendo nuevas oportunidades a varias industrias.

3. DINGTANG y el Laboratorio Tongyi lanzan Fun-ASR, un nuevo modelo de reconocimiento de voz de gran escala

DingTalk y el Laboratorio Tongyi han lanzado un nuevo modelo de reconocimiento de voz de gran escala llamado Fun-ASR, que tiene ventajas como la eficiente conversión de señales de voz complejas, la identificación precisa de términos industriales, y el soporte para el reconocimiento de múltiples idiomas y acentos. Además, Fun-ASR ofrece servicios de entrenamiento personalizado de modelos, satisfaciendo las necesidades individuales de las empresas, lo que marca un avance importante en la ruta de herramientas de colaboración empresarial inteligentes de DingTalk.

【Resumen de AiBase:】
🧠 Fun-ASR puede convertir eficientemente señales de voz complejas y reconocer con precisión términos industriales.
🌍 Soporta el reconocimiento de múltiples idiomas y acentos, ampliando las aplicaciones.
🛠️ Ofrece servicios de entrenamiento personalizado de modelos, satisfaciendo las necesidades individuales de las empresas.

4. La versión china de CodeBuddy IDE de Tencent inicia su prueba pública, integrando DeepSeek V3.1

La versión china de CodeBuddy IDE de Tencent ha iniciado oficialmente su prueba pública, apoyando varios modelos avanzados como DeepSeek-V3.1-Think, logrando así una experiencia de programación automatizada integral desde la demanda hasta la implementación.

【Resumen de AiBase:】
✅ CodeBuddy IDE es la primera plataforma integral de IA en China que admite DeepSeek V3.1.
🧠 DeepSeek-V3.1-Think destaca en habilidades de programación, obteniendo una alta puntuación del 71.6%.
🚀 Incluye herramientas como Tencent Cloud EdgeOne Pages, ayudando a los desarrolladores a construir y desplegar aplicaciones rápidamente.

5. Se lanza Vercel AI Gateway! Llama a cien modelos de IA con un solo clic, crea aplicaciones inteligentes sin barreras

El lanzamiento de Vercel AI Gateway proporciona a los desarrolladores una plataforma eficiente y conveniente para acceder a modelos de IA, resolviendo los complejos problemas de gestión de múltiples modelos y proveedores. Sus puntos destacados incluyen el acceso único a diversos modelos de IA, costo cero adicional, alto rendimiento y confiabilidad, así como una integración sin problemas con SDKs de IA.

【Resumen de AiBase:】
🧠 Soporta cientos de modelos de IA, cubriendo proveedores principales como OpenAI y Anthropic.
💰 Costo cero adicional, admite la función BYOK, mejorando la flexibilidad y transparencia.
⚡ Alto rendimiento y fiabilidad, con un retardo inferior a 20 milisegundos, asegurando la operación estable de la aplicación.
Enlace detallado: https://vercel.com/blog/ai-gateway-is-now-generally-available

6. Anthropic integra Claude Code en sus planes empresariales para mejorar la capacidad de gobernanza del desarrollo de IA

Anthropic ha integrado Claude Code en sus planes empresariales, mejorando así la capacidad de gobernanza del desarrollo de IA, y también ha lanzado una API de cumplimiento para aumentar el control y la auditoría de la codificación asistida por IA en empresas.

【Resumen de AiBase:】
🧠 Claude Code se integra en el servicio de suscripción empresarial de Anthropic, convirtiéndose en parte de su conjunto de herramientas de desarrollo.
🔒 La nueva API de cumplimiento proporciona acceso programático para que los líderes de TI y seguridad rastreen el uso y los indicadores de contenido.
📈 Anthropic experimentó un crecimiento significativo en el número de usuarios durante el verano de 2025, lo que llevó a la empresa a lanzar un tablero de monitoreo y límites de uso para gestionar la actividad.

7. Mobile-Agent-v3 de Alibaba aparece repentinamente! Un gran avance en el campo de la automatización GUI

El artículo presenta el tercer marco de inteligencia artificial GUI de Alibaba, Mobile-Agent-v3, y el modelo de capa virtual multimodal de código abierto GUI-Owl, mostrando su desempeño sobresaliente en varios benchmarks autorizados y destacando su gran avance técnico en el campo de la automatización GUI.

【Resumen de AiBase:】
📱 Mobile-Agent-v3 es un marco multientidad multiplataforma construido sobre GUI-Owl, logrando operaciones sin interrupción entre aplicaciones.
🖼️ GUI-Owl puede comprender con precisión el diseño de la interfaz y convertir instrucciones de lenguaje natural en operaciones en la pantalla.
🌐 El proyecto de código abierto GUI-Owl proporciona a los desarrolladores globales una base para construir soluciones personalizadas, impulsando la innovación tecnológica en la industria.
Enlace detallado: https://github.com/X-PLUG/MobileAgent

8. Alibaba lanza una nueva plataforma de programación Agentic Qoder

La plataforma de programación Qoder de Alibaba mejora significativamente la eficiencia del desarrollo de software mediante su poderosa capacidad de ingeniería de contexto y agentes de IA. Su compatibilidad con la función Repo Wiki y un sistema de memoria a largo plazo le permite a los desarrolladores completar tareas de manera más eficiente y mostrar un desempeño sobresaliente en pruebas reales.

【Resumen de AiBase:】
🧠 Qoder posee una fuerte capacidad de ingeniería de contexto, permitiendo recuperar rápidamente archivos de código masivos.
🔄 Incorpora un sistema de memoria a largo plazo, que puede completar tareas comunes automáticamente según los hábitos del usuario.
🚀 Nueva función Quest Mode, que transforma requisitos abstractos en especificaciones de diseño detalladas y completa autonomamente las tareas de desarrollo.
Enlace detallado: https://qoder.com

9. El equipo IDEA de Tsinghua lanza GUAVA! Genera un avatar 3D con una sola foto en 0,1 segundos, ¡una ruptura tecnológica que sorprende al mundo!

El marco GUAVA desarrollado por la Universidad de Tsinghua y el Instituto de Economía Digital de la Región de Guangdong-Hong Kong-Macao ha logrado un hito histórico en la generación de avatares 3D. Este marco puede crear un modelo de avatar 3D de alta precisión en 0,1 segundos utilizando solo una foto, mejorando significativamente la eficiencia y realismo, brindando un sólido respaldo técnico para múltiples industrias.

【Resumen de AiBase:】
🚀 El marco GUAVA puede generar avatares 3D en 0,1 segundos, mejorando significativamente la eficiencia.
🧠 Introduce modelos 3D gaussiana y modelos corporales EHM, logrando efectos altamente realistas.
🌐 Proyecto de código abierto promueve la innovación de desarrolladores globales y fomenta la difusión de la tecnología.
Enlace detallado: https://eastbeanzhang.github.io/GUAVA/

10. Google Search agrega un AI Agent, reserva de restaurantes y servicios personalizados se realizan con un solo clic!

El motor de búsqueda de Google ha agregado una función de AI Agent, ofreciendo a los usuarios una experiencia de búsqueda más inteligente. Esta función puede completar automáticamente la reserva de restaurantes y personalizar los resultados de búsqueda según las preferencias personales, simplificando el proceso de reserva y mejorando la conveniencia. Además, el AI Agent también admite compartir los resultados de búsqueda, facilitando decisiones conjuntas, y en el futuro se expandirá a más aplicaciones.

【Resumen de AiBase:】
🍽️ La función de AI Agent ayuda a los usuarios a reservar restaurantes fácilmente, satisfaciendo necesidades personalizadas.
👥 Los usuarios pueden compartir resultados de búsqueda, tomar decisiones conjuntas con amigos, mejorando la experiencia interactiva.
🌍 La función ya está disponible en 180 países, y en el futuro se expandirá a más áreas de aplicación.

11. VAST lanza Tripo 3.0! El nuevo rey de la modelización 3D impulsada por IA, con un conjunto de datos de 40 millones de elementos que impresionan al mundo

El artículo presenta la versión Tripo 3.0 lanzada por la empresa VAST, que marca una nueva etapa en la creación de contenido 3D impulsada por IA. El modelo de gran escala de VAST de 3D ya ha servido a más de 3 millones de desarrolladores y es utilizado por más de 700 empresas, demostrando el enorme potencial de la IA en el campo de la modelización 3D.

【Resumen de AiBase:】
🚀 Tripo 3.0 es un gran avance en la tecnología de modelización 3D impulsada por IA, impulsando cambios en la industria.
📊 VAST posee un conjunto de datos 3D de alta calidad de 40 millones, proporcionando un fuerte respaldo para los modelos de IA.
💼 La elección de más de 700 clientes empresariales demuestra el valor comercial y utilidad de la tecnología de modelización 3D impulsada por IA.

Tencent lanza la nueva versión de IMA 2.0: se presenta el modo de tareas, se añaden funciones como «Puntos de IA»

El 23 de octubre, Tencent presentó oficialmente la nueva versión actualizada de IMA 2.0 en el evento IMA Open Day. Como la primera biblioteca de conocimiento personal que integra capacidad de Agente en la industria, IMA 2.0 lanzó el «modo de tareas», convirtiendo a la biblioteca de conocimiento de una herramienta de búsqueda y preguntas simples en un compañero inteligente capaz de comprender tareas complejas, desglosar pasos por sí mismo, utilizar herramientas y completar todo el proceso.

La programación de Doubao se actualiza, lanza dos modos de creación y preguntas y respuestas

Recientemente, la programación de Doubao lanzó oficialmente dos modos de creación y preguntas y respuestas, ofreciendo a los usuarios una experiencia de programación más flexible y eficiente. Esta actualización no solo agregó funciones útiles, sino que también redujo aún más la barrera para programar, permitiendo que incluso los usuarios sin conocimientos previos puedan completar creaciones profesionales con facilidad. En el modo de creación, la programación de Doubao agregó las funciones de imagen de referencia y lienzo; los usuarios solo necesitan cargar una imagen de referencia o usar el lienzo para dibujar diagramas de flujo o diagramas de cuadros, y el modelo puede restablecer directamente el diseño, ayudando a los usuarios a lograr los resultados deseados del producto. Esta función facilita enormemente a los usuarios sin conocimientos de programación, permitiéndoles acceder a la creación profesional.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Diario de IA: Jiemeng lanza la función inteligente de múltiples cuadros; Qiling 2.1 actualiza los primeros y últimos cuadros; DingTalk presenta el modelo de reconocimiento de voz Fun-ASR

站长之家

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

¡ChatGPT se convierte en un asistente de vida versátil! Conéctese con Spotify, Booking, Canva y otros ocho plataformas con un solo clic

Tencent lanza la nueva versión de IMA 2.0: se presenta el modo de tareas, se añaden funciones como «Puntos de IA»

La programación de Doubao se actualiza, lanza dos modos de creación y preguntas y respuestas

Huawei HarmonyOS 6 lanzado: la inteligencia artificial en el extremo se implementa completamente, Huawei acelera la batalla clave de la inteligencia artificial

Anthropic lanza la versión web de Claude Code, puede ejecutar tareas de programación en el navegador

Diario de IA: Visual China alcanza un acuerdo con varias empresas de modelos grandes; OpenAI suspende urgentemente la generación de figuras fallecidas en Sora; Google lanza una herramienta de integración de datos cartográficos Gemini

Strella recauda 14 millones de dólares en financiación para impulsar la innovación en la tecnología de entrevistas de inteligencia artificial y la investigación de clientes

El modelo de inteligencia artificial C2S-Scale 27B para vías de tratamiento del cáncer desarrollado por Google DeepMind y la Universidad de Yale

Claude se integra profundamente con Microsoft 365, mejorando aún más la eficiencia empresarial!

Toutiao lanza el modelo grande Douyin 1.6: el primer modelo nacional que admite profundidad de pensamiento ajustable

Noticias de IA relacionadas recomendadas

¡ChatGPT se convierte en un asistente de vida versátil! Conéctese con Spotify, Booking, Canva y otros ocho plataformas con un solo clic

Tencent lanza la nueva versión de IMA 2.0: se presenta el modo de tareas, se añaden funciones como «Puntos de IA»

La programación de Doubao se actualiza, lanza dos modos de creación y preguntas y respuestas

Huawei HarmonyOS 6 lanzado: la inteligencia artificial en el extremo se implementa completamente, Huawei acelera la batalla clave de la inteligencia artificial

Anthropic lanza la versión web de Claude Code, puede ejecutar tareas de programación en el navegador

Diario de IA: Visual China alcanza un acuerdo con varias empresas de modelos grandes; OpenAI suspende urgentemente la generación de figuras fallecidas en Sora; Google lanza una herramienta de integración de datos cartográficos Gemini

Strella recauda 14 millones de dólares en financiación para impulsar la innovación en la tecnología de entrevistas de inteligencia artificial y la investigación de clientes

El modelo de inteligencia artificial C2S-Scale 27B para vías de tratamiento del cáncer desarrollado por Google DeepMind y la Universidad de Yale

Claude se integra profundamente con Microsoft 365, mejorando aún más la eficiencia empresarial!

Toutiao lanza el modelo grande Douyin 1.6: el primer modelo nacional que admite profundidad de pensamiento ajustable

GEO Services