Bienvenido a la sección "AI Daily"! Aquí es tu guía diaria para explorar el mundo de la inteligencia artificial. Cada día te presentamos los temas más destacados del ámbito de la IA, enfocándonos en desarrolladores para que comprendas las tendencias tecnológicas y conozcas las aplicaciones innovadoras de productos de IA.

Productos de IA recientes Haga clic para más información:https://top.aibase.com/

1. Se informa que Bilibili lanzará una herramienta de creación de IA con el código "H", impulsando su negocio de podcasts visuales

Bilibili está expandiendo activamente su negocio de podcasts visuales y planea lanzar una serie de políticas de apoyo, incluyendo una herramienta de creación de IA llamada "Código H". Esta herramienta tiene como objetivo ayudar a los creadores de podcasts a ahorrar tiempo en la búsqueda de material de video y edición, mejorando así su eficiencia creativa. Además, Bilibili espera atraer significativamente a creadores de podcasts durante las vacaciones de verano, promoviendo que los podcasts visuales se conviertan en un punto clave de crecimiento.

image.png

【Resumen de AiBase:】

🎙️ Bilibili lanzará una herramienta de creación de IA con el código "H", para mejorar la eficiencia en la producción de podcasts visuales.

📊 La duración de consumo de podcasts visuales alcanzó 2.59 mil millones de minutos en el primer trimestre de 2025, con una base de usuarios superior a los 40 millones.

🏙️ Bilibili ofrece soporte de tráfico y espacios gratuitos para grabaciones, apoyando la transformación de los creadores de contenido.

2. Zhiyuan lanza el robot "Lingxi X2-N": puede cambiar entre dos formas (ruedas y patas)

El robot Lingxi X2-N de Zhiyuan destaca por su diseño dual único, demostrando una gran adaptabilidad y flexibilidad, pudiendo desempeñarse bien en diferentes escenarios.

image.png

【Resumen de AiBase:】

🤖 Diseño dual, cambio libre entre ruedas y patas, adaptándose a diversos escenarios y terrenos complejos.

⛰️ En modo de patas, posee una excelente capacidad de salto, puede subir escaleras ciegamente y transportar objetos pesados con estabilidad.

🛞 En modo de ruedas, logra un movimiento eficiente, con la característica de "moverse mientras desliza", manejando fácilmente terrenos complejos como puentes de un solo lado o pendientes.

3. Yushu Technology se prepara para su IPO en el mercado de ciencia y tecnología, con una valoración de cien mil millones de yuanes respaldada por Alibaba y Tencent

Yushu Technology acelera su preparación para su IPO en el mercado de ciencia y tecnología, y ha completado una financiación de aproximadamente 700 millones de yuanes en la ronda C, con una valoración posterior a la inversión de 12.000 millones de yuanes. Esta ronda de financiación fue liderada por varios gigantes de la industria, lo que indica que su proceso de cotización ha entrado en una fase crítica.

image.png

【Resumen de AiBase:】

🚀 Yushu Technology planea realizar su oferta pública inicial (IPO) en el mercado de ciencia y tecnología.

💰 Ha completado una ronda de financiación de 700 millones de yuanes, con una valoración posterior a la inversión de 12.000 millones de yuanes.

🤝 El grupo de financiación es muy prestigioso, incluyendo instituciones conocidas como China Mobile, Tencent y Alibaba.

4. Modelo de lenguaje multimodal abierto EarthMind: una herramienta revolucionaria para el análisis de datos de observación terrestre

EarthMind es un modelo de lenguaje multimodal abierto que busca analizar y comprender eficientemente datos complejos de observación terrestre. Introduce un módulo de pista de atención espacial (SAP) para mejorar la precisión de la comprensión a nivel de píxeles y realiza una integración efectiva y análisis de datos de sensores mediante fusión multimodal y comprensión de múltiples grados de detalle.

image.png

【Resumen de AiBase:】

🧠 Introduce un módulo de pista de atención espacial (SAP), mejorando la precisión de la comprensión a nivel de píxeles.

🔄 A través de la fusión multimodal y la comprensión de múltiples grados de detalle, EarthMind logra una integración y análisis efectivos de datos de sensores.

🌍 EarthMind es un modelo de lenguaje multimodal abierto, especializado en procesar datos de observación terrestre complejos.

5. Actualización importante de Gemini CLI: procesamiento de audio y video + nuevas funciones de privacidad, ¡la felicidad de los desarrolladores!

La última versión de Gemini CLI trae varias mejoras y optimizaciones, incluyendo el procesamiento de audio y video, mejoras en Markdown, actualizaciones en protección de privacidad, optimizaciones de compatibilidad y mejoras en estabilidad. Estas actualizaciones amplían aún más sus aplicaciones, brindando a los desarrolladores una experiencia de trabajo más eficiente y flexible.

image.png

【Resumen de AiBase:】

🎥 Capacidad de procesamiento de audio y video nueva, ampliando las aplicaciones de la herramienta

🔒 Funciones de protección de privacidad reforzadas, control más transparente de los datos de los usuarios

⚙️ Optimización de compatibilidad, soportando más editores y uso en múltiplataformas

Detalles: https://github.com/google-gemini/gemini-cli

6. Asistente de escritorio AI Invisible Glass: se volvió popular al ser abierto, registra detalles de la vida de forma inteligente

Glass es un asistente de escritorio de IA de código abierto desarrollado por el equipo Pickle, destinado a convertirse en una "extensión del cerebro digital" del usuario. Está diseñado específicamente para macOS, funciona en segundo plano, captura en tiempo real las actividades de la pantalla y el audio, analiza inteligentemente la información y la convierte en conocimiento estructurado, mejorando la eficiencia en el trabajo y la vida.

image.png

【Resumen de AiBase:】

✨ Glass es una herramienta de escritorio ligera y rápida, diseñada específicamente para macOS, que captura en tiempo real las actividades de la pantalla y el audio.

🧠 Posee una fuerte capacidad de comprensión contextual, capaz de organizar información dispersa en una base de conocimientos útil.

🔒 Utiliza un "diseño invisible", sin interferir con la privacidad del usuario ni con la fluidez de la operación.

Detalles: https://github.com/pickle-com/glass

7. Claude lanzará próximamente el modelo Claude Neptune v3, con capacidades matemáticas extraordinarias

Anthropic está probando un nuevo modelo de IA con el nombre en código "Claude Neptune v3", que podría ser el antecesor de Claude4.5 o un avance completamente nuevo. Actualmente está en fase de prueba interna con el equipo rojo, enfocándose en probar la robustez del sistema de IA constitucional y mostrando un excelente desempeño en capacidades de razonamiento matemático.

image.png

【Resumen de AiBase:】

🔍 Claude Neptune v3 se encuentra en fase de prueba interna con el equipo rojo, enfocado en probar la robustez del sistema de IA constitucional.

🧠 Este modelo muestra un desempeño sobresaliente en capacidades de razonamiento matemático, posiblemente comparable a los modelos o3Pro de OpenAI y Kingfall de Google.

🚀 Anthropic planea optimizar la ventana de contexto y la capacidad de uso de herramientas del modelo a través de Neptune v3, para enfrentar necesidades de tareas complejas.

8. OpenAI anuncia que GPT-5 integrará varios modelos, logrando un nuevo avance

OpenAI anunció que GPT-5 integrará varios modelos, logrando un nuevo avance. Este modelo está programado para salir en verano, combinando la capacidad de razonamiento de la serie O con las funciones multimodales de la serie GPT, mejorando el rendimiento general y reduciendo la necesidad para los usuarios de cambiar entre varios modelos.

image.png

【Resumen de AiBase:】

🧠 GPT-5 integrará capacidades de razonamiento y funcionalidades multimodales

📅 GPT-5 se espera que sea lanzado en verano

🔄 El nuevo modelo pretende reducir la necesidad de los usuarios de cambiar entre distintos modelos