Bienvenido al programa «Diario de IA»! Aquí es tu guía diaria para explorar el mundo de la inteligencia artificial. Cada día te presentamos los temas más destacados en el campo de la IA, enfocándonos en desarrolladores para que comprendas las tendencias tecnológicas y conozcas las aplicaciones innovadoras de productos de IA.

Productos de IA recientes Haz clic para obtener más información: https://app.aibase.com/zh

1. El rendimiento de Kimi k2 es alabado por superar a GPT-5, Moonshot AI obtiene una importante financiación de varios cientos de millones de dólares

La empresa emergente de modelos grandes en China, Moonshot AI, está a punto de completar una nueva ronda de financiación de varios cientos de millones de dólares. Esta financiación ha ocurrido poco tiempo después de la última ronda de financiación de aproximadamente 300 millones de dólares que Moonshot AI reveló (la última información pública fue en agosto de 2024), lo que muestra que la confianza del mercado capitalista en la empresa ha aumentado nuevamente.

【Resumen de AiBase:】

🚀 El modelo Kimi k2 supera a GPT-5 y Claude4.5, generando atención global.

💰 Moonshot AI completa una financiación de varios cientos de millones de dólares, mostrando la alta confianza del mercado capitalista.

🌐 La lanzamiento de Kimi k2 hace que Moonshot AI vuelva a ser el centro de atención en el escenario global de IA.

2. Anthropic lanza la función «Memoria» para usuarios de Claude Pro/Max, logrando mejoras personalizadas y de seguridad

Anthropic ha lanzado una nueva función llamada «Memoria» para las versiones Pro y Max de su modelo de IA líder, Claude, con el objetivo de mejorar la coherencia y la experiencia personalizada en las conversaciones. Esta función se centra en la privacidad y la separación, permitiendo a los usuarios controlar el contenido de la memoria y ofreciendo un modo de «conversación invisible» para garantizar que los datos no sean guardados. 【Resumen de AiBase:】

🧠 La función de memoria puede recordar el contenido del proyecto, las preferencias del usuario y los procesos de trabajo, mejorando la coherencia de la conversación.

🔒 Diseño de memoria independiente del proyecto y control del usuario, garantizando privacidad y aislamiento de datos.

🕵️‍♂️ Nuevas funciones de «conversación invisible», asegurando que los datos de la conversación no sean guardados ni mostrados en registros.

3. Universidad de Ciencia y Tecnología de China y ByteDance lanzan el modelo de generación de videos largos MoGA: generación de cortos de múltiples escenas en minutos

La Universidad de Ciencia y Tecnología de China y ByteDance han lanzado un modelo de generación de videos largos basado en un algoritmo MoGA, logrando generar videos de alta calidad en minutos, lo que marca un avance clave de la tecnología nacional en la competencia global de IA.

【Resumen de AiBase:】

🎥 Generación de videos de múltiples escenas en minutos, rompiendo con los límites tradicionales de corto tiempo.

🧠 Introducir el algoritmo MoGA, optimizar el procesamiento de contexto y el costo computacional.

🚀 Soportar aplicaciones en múltiples áreas como cine y publicidad, tener potencial para implementación industrial.

Enlace detallado: https://jiawn-creator.github.io/mixture-of-groups-attention/

4. Tencent lanza la nueva versión ima2.0: modo de tarea activado, nuevas funciones como «Puntos de IA»

Tencent lanzó oficialmente la nueva versión actualizada de ima2.0 durante la actividad ima Open Day, introduciendo el «modo de tarea», lo que convierte a la base de conocimientos de una herramienta de búsqueda y respuestas simple en un compañero inteligente capaz de comprender tareas complejas, desglosar pasos por sí mismo, llamar a herramientas y completar todo el proceso. Además, se agregó la función «Puntos de IA», que apoya la ejecución paralela de múltiples tareas y el intercambio colaborativo, mejorando la eficiencia de la gestión del conocimiento.

image.png

【Resumen de AiBase:】

🔥 El modo de tarea de ima2.0 permite descomponer y ejecutar tareas complejas automáticamente.

💡 Se añadió la función «Puntos de IA», que genera resúmenes estructurados automáticamente, capturando rápidamente los puntos importantes.

🤝 Apoyo a múltiples tareas paralelas y compartir colaborativo, mejorando la eficiencia del uso de la base de conocimiento.

5. Los gafas inteligentes de Alibaba Quark inician la venta anticipada: soportan el pago mediante «Ver» de Alipay

Alibaba Quark presenta gafas inteligentes de IA, que soportan pagos mediante Alipay, tienen un diseño estético excelente y una fuerte capacidad de toma de fotografías, satisfaciendo las diversas necesidades de los usuarios.

image.png

【Resumen de AiBase:】

📱 Soporta el pago mediante «Ver» de Alipay, siendo la primera gafa inteligente integrada con identificación biométrica de pago en China.

👓 Diseño de varillas de 7,5 mm muy finas y marcos delgados, con un peso total de 42 gramos, cómodas de usar.

📸 Incorpora el modo de noche SuperRaw y un sistema de doble estabilización, mejorando la capacidad de toma de fotos.

6. Microsoft Copilot añade chat grupal, memoria y modo Edge AI: máximo de 32 personas en colaboración en tiempo real

Microsoft realizó una importante actualización de otoño para Copilot, añadiendo la función de chat grupal, la memoria a largo plazo y el modo Edge AI, mejorando la capacidad de colaboración, personalización y la integración transservicios.

【Resumen de AiBase:】

🌟 Introduce la función de «grupo» de chat, permitiendo la colaboración en tiempo real de hasta 32 personas y la asignación de tareas.

🧠 Añade la función de «memoria a largo plazo», guardando información clave del usuario y recuperándola automáticamente en conversaciones posteriores.

🌐 El navegador Edge lanza el modo Copilot, proporcionando análisis de contenido y sugerencias inteligentes.

7. El navegador Opera Neon lanza un agente de investigación profunda «ODRA»

El navegador Opera Neon lanzó una nueva función de IA llamada Opera Deep Research Agent (ODRA), lo que marca un avance importante en la construcción del ecosistema de IA del navegador Opera. ODRA mejora la eficiencia y precisión en la consulta de preguntas complejas mediante procesamiento paralelo, demostrando su capacidad para competir con gigantes de la industria.

image.png

【Resumen de AiBase:】

🌍 ODRA es parte central del motor de IA propio de Opera, con un rendimiento significativamente mejorado tras más de dos años de investigación y optimización.

⚙️ ODRA utiliza operaciones paralelas, dividiendo tareas complejas en múltiples subproblemas para mejorar la eficiencia de investigación.

🔍 ODRA se une como el cuarto agente a Opera Neon, los usuarios pueden iniciar la función de investigación a través de un cuadro de búsqueda integral.

8. El modelo PaddleOCR-VL de Baidu alcanza la cima del ranking mundial OCR, liderando el ranking de tendencias de Huggingface durante cinco días consecutivos

El modelo PaddleOCR-VL lanzado por el equipo de Paddle de Baidu causó sensación en el campo del OCR, convirtiéndose en el modelo de OCR más destacado debido a su potente rendimiento y soporte multilingüe.

QQ20251024-135355.png

【Resumen de AiBase:】

✅ PaddleOCR-VL obtuvo 92,56 puntos en la evaluación OmniDocBench V1.5, superando a los principales modelos y alcanzando la cima del ranking mundial de OCR.

🌐 Soporta la identificación de 109 idiomas, puede analizar texto, tablas, fórmulas y gráficos, y tiene la capacidad de reconstruir la estructura semántica de documentos.

🔍 Las instituciones como Baidu, DeepSeek y el Laboratorio de IA de Shanghai abrieron el modelo OCR, con el objetivo principal de proporcionar una base de datos para el entrenamiento de grandes modelos.