Bienvenido al programa de noticias de IA! Aquí es donde puedes explorar diariamente el mundo de la inteligencia artificial. Cada día te presentamos las principales noticias del campo de la IA, enfocándonos en los desarrolladores para que comprendas las tendencias tecnológicas y conozcas las aplicaciones innovadoras de la IA.

Nuevos productos de IA haz clic para saber más: https://top.aibase.com/

1. Xiaomi transfirió varias marcas comerciales de "Kimi" a Moon's Dark Side

Xiaomi ha transferido las marcas comerciales de "Kimi" a Moon's Dark Side, una empresa especializada en asistentes de IA. Este movimiento podría ser una optimización estratégica de recursos por parte de Xiaomi, mientras que también ayuda a Moon's Dark Side a expandir su negocio de asistentes inteligentes.

image.png

【Resumen de AiBase:】

🌟 Xiaomi transfirió varias marcas comerciales de "Kimi" a Beijing Moon's Dark Side Technology Co., Ltd., optimizando los recursos no centrales de la marca.

🤖 El asistente inteligente Kimi de Moon's Dark Side se lanzó en 2023; esta transferencia de marcas comerciales le proporciona apoyo para su desarrollo.

🔍 Esta transacción podría ofrecer mejores oportunidades de desarrollo del mercado a ambas partes, promoviendo el avance de la asistencia inteligente.

2. Microsoft Bing lanza nueva herramienta de creación de videos Bing Video Creator, permitiendo a los usuarios generar fácilmente videos con IA

Microsoft Bing ha lanzado Bing Video Creator, basado en el modelo OpenAI Sora. Los usuarios pueden generar videos cortos gratuitamente mediante descripciones de texto, pero actualmente solo está disponible para dispositivos móviles y la velocidad de generación es lenta.

image.png

【Resumen de AiBase:】

✨ Nueva función: por primera vez, Bing Video Creator está disponible de forma gratuita. Solo se necesita una breve descripción de texto para generar videos.

📱 Restricciones: actualmente solo está disponible para dispositivos móviles y aún no se ha lanzado en escritorio, lo que afecta la experiencia de algunos usuarios.

💰 Mecanismo de incentivos: los usuarios pueden obtener puntos a través de búsquedas o compras, y después de generar 10 videos gratuitamente, deben pagar para continuar.

3. ElevenLabs lanza nueva plataforma de interacción conversacional Conversational AI 2.0: ¡Los asistentes de voz de IA son incluso más comprensivos que los humanos!

ElevenLabs lanzó Conversational AI 2.0, una plataforma que ha logrado avances significativos en fluidez del diálogo, soporte multiidioma y capacidades empresariales, abriendo nuevas posibilidades para el servicio al cliente, marketing y creación de contenido.

image.png

【Resumen de AiBase:】

Incorpora modelos avanzados de conversación alternada, capturando precisamente el ritmo de la conversación del usuario para evitar interrupciones y mejorar la fluidez del diálogo.

Soporta 32+ idiomas con cambio fluido, con funciones integradas de detección automática de idioma, ayudando a las empresas globales con servicios al cliente.

Integra tecnología RAG (Retrieval-Augmented Generation), extrayendo información de la base de conocimientos de la empresa para asegurar la profesionalidad y precisión de las respuestas.

Enlace de detalles: https://elevenlabs.io/blog/conversational-ai-2-0

4. La función Gemini Live de Google llega oficialmente a la plataforma iOS, iniciando una nueva experiencia de reconocimiento de IA

La función Gemini Live de Google ya está disponible en plataformas iOS y iPadOS, permitiendo el reconocimiento de escenas y contenido de la pantalla mediante IA y actualmente gratuita. Esta función ofrece una experiencia conveniente de obtención de información a través de la cámara y el compartir pantalla, pero por ahora solo está disponible para usuarios de EE.UU.

image.png

【Resumen de AiBase:】

✨ Gemini Live ahora soporta iOS/iPadOS, utilizando IA para identificar objetos rápidamente e proporcionar información.

📱 Función de compartir pantalla permite a los usuarios compartir fácilmente contenido, mejorando la experiencia de interacción.

🌍 La función solo está disponible en EE.UU., y Google está impulsando la aplicación más amplia de la tecnología de IA.

5. Character.AI lanza nueva función AvatarFX, permitiendo a los usuarios crear videos animados personalizados

Character.AI lanzó la herramienta AvatarFX, permitiendo a los usuarios crear videos animados personalizados, además de añadir funciones de 'escena' y 'flujo', enfrentándose a problemas de mal uso.

image.png

【Resumen de AiBase:】

🌟 Character.AI lanzó la herramienta AvatarFX, permitiendo a los usuarios crear videos animados personalizados.

🎬 Las nuevas funciones de 'escena' y 'flujo' permiten a los usuarios compartir creaciones de personajes.

⚠️ Character.AI enfrenta demandas legales debido a incidentes de abuso, y la plataforma tiene riesgos de seguridad.

Enlace de detalles: https://blog.character.ai/character-ai-unveils-new-ways-to-create/

6. OpenAI reescribe Codex CLI usando Rust, dejando atrás Node.js

OpenAI anunció que está migrando su herramienta de programación AI Codex CLI de Node.js a Rust, un cambio que ha traído ventajas como la optimización del rendimiento, mejora de la seguridad y la instalación sin dependencias.

image.png

【Resumen de AiBase:】

🌟 Codex CLI ha sido migrado de TypeScript y Node.js a Rust, trayendo optimización del rendimiento y mejoras de seguridad.

🔒 Rust implementa la instalación sin dependencias, soporta entornos de arena y mejora la compatibilidad entre plataformas.

🚀 Las características de Rust ayudan a Codex CLI a convertirse en un cliente y servidor de protocolo de contexto del modelo, con un rendimiento excepcional.

7. La Universidad Nacional de Singapur lanza OmniConsistency: estilo de imagen estilizada a bajo costo, desafiando a GPT-4o!

Un equipo de la Universidad Nacional de Singapur lanzó el proyecto OmniConsistency, que mediante un marco de aprendizaje único y arquitectura modular logra la combinación perfecta de estilización de imágenes y consistencia a un costo extremadamente bajo, proporcionando una poderosa herramienta para desarrolladores.

image.png

【Resumen de AiBase:】

✨ Utiliza un marco de aprendizaje basado en pares de imágenes para aprender la consistencia de la migración de estilo, solo necesitando 2600 pares de imágenes de alta calidad y 500 horas de potencia GPU para obtener resultados impresionantes.

🔄 Soporta arquitectura modular, compatible con módulos LoRA de estilización existentes, fácil de integrar en diversos proyectos.

🌟 Inyecta capacidad comercial en el ecosistema abierto, promoviendo el desarrollo de la creación artística de IA.

Enlace de detalles: https://github.com/showlab/OmniConsistency

8. Hume AI lanza EVI 3: un asistente de voz que entiende tus emociones, ¡más rápido que GPT-4o!

Hume AI lanzó el tercer modelo de interacción vocal EVI3, con capacidades excepcionales de comprensión emocional y experiencias interactivas personalizadas, marcando un gran avance en el campo de la interacción emocional y comunicación natural de la IA vocal.

image.png

【Resumen de AiBase:】

✨ EVI3 puede identificar precisamente las emociones en la voz del usuario y generar sonidos y personalidades específicas, logrando la fusión perfecta entre la inteligencia emocional y la interacción vocal.

🚀 Con baja latencia y respuesta inteligente, la latencia de inferencia es de solo 300 milisegundos, superando la expresión emocional y la naturalidad de GPT-4o.

🌐 Aplicable en múltiples escenarios, incluida la atención al cliente y la creación de contenido, y se planea expandir el soporte multilingüe para cubrir mercados globales.

Enlace de detalles: https://demo.hume.ai/

9. Revelaciones internas: Apple posee un modelo de IA de 150 mil millones de parámetros comparable a ChatGPT pero lo rechaza publicarlo

Apple abrirá su modelo básico en WWDC, pero su rendimiento es limitado y no hay planes para divulgar su modelo de IA interna más avanzado. Las discrepancias entre los líderes han retrasado varios proyectos de IA, y WWDC se centrará más en envases de marketing y actualizaciones menores.

image.png

【Resumen de AiBase:】

🍎 Apple planea abrir un modelo de IA con aproximadamente 3 mil millones de parámetros, con rendimiento moderado y limitado, principalmente para funciones básicas.

🚀 Apple tiene modelos de IA internos de mayor escala, con hasta 150 mil millones de parámetros, pero solo se utilizan para pruebas internas y no hay planes para divulgarlos.

⏳ Las discrepancias entre los líderes de Apple han retrasado varios proyectos de IA, y WWDC se centra más en pequeñas actualizaciones que en funciones innovadoras.

10. Google lanza la aplicación AI Edge Gallery, permitiendo procesamiento de IA en smartphones sin conexión

Google lanzó la aplicación AI Edge Gallery, permitiendo a los usuarios ejecutar modelos de IA complejos en sus teléfonos móviles sin conexión, mejorando la privacidad y soportando diversas funciones de IA, aunque la experiencia de instalación y uso todavía necesita mejorar.

image.png

【Resumen de AiBase:】

🌟 Google lanzó la aplicación AI Edge Gallery, permitiendo el procesamiento de modelos de IA sin conexión, mejorando la privacidad.

📱 La aplicación admite la descarga de modelos de Hugging Face, ofreciendo funciones como diálogos en múltiples rondas y preguntas de visualización de preguntas de IA, todo realizado localmente.

🔒 El procesamiento local soluciona problemas de privacidad, especialmente útil para industrias sensibles como la salud y la financiera.

Enlace de detalles: https://github.com/google-ai-edge/gallery

11. API de inferencia de Cerebras se abre por completo, otorgando a los desarrolladores un millón de tokens gratuitos diarios

Cerebras Systems anunció que su API de inferencia está completamente abierta, eliminando la lista de espera y proporcionando un millón de tokens gratuitos diarios, mejorando significativamente la eficiencia de la inferencia de IA, especialmente destacada en áreas como el procesamiento en tiempo real de voz y video.

image.png

【Resumen de AiBase:】

🚀 La API de inferencia está abierta y ofrece un millón de tokens gratuitos diarios, reduciendo significativamente los costos para los desarrolladores.

⚡ La velocidad de inferencia es 20 veces más rápida que la de una GPU, especialmente útil para modelos de inferencia compleja y tareas de generación de código.

🌐 Compatible con modelos de código abierto populares, integrable fácilmente con Hugging Face y Meta, simplificando el flujo de trabajo de los desarrolladores.

12. NVIDIA y MIT colaboran en el lanzamiento del marco Fast-dLLM, aumentando la velocidad de inferencia de IA 27.6 veces

NVIDIA, junto con MIT y la Universidad de Hong Kong, lanzó el marco Fast-dLLM, que mediante mecanismos innovadores mejora significativamente la velocidad de inferencia de modelos de difusión, manteniendo simultáneamente la calidad de generación, proporcionando un fuerte apoyo para las aplicaciones de IA.

image.png

【Resumen de AiBase:】

🌟 Aumento rápido: alcanza un aumento de hasta 27.6 veces en la velocidad de inferencia mediante el mecanismo de caché KV aproximado por bloques.

🔍 Tecnología innovadora: estrategia de decodificación en paralelo sensible a la confianza asegura la calidad de generación, reduciendo la dependencia de conflictos.