¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentamos los temas más relevantes del campo de la IA, enfocados en desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Productos de IA nuevos haga clic aquí para obtener más información: https://top.aibase.com/

1. xAI, de Musk, lanza las versiones beta de Grok-2 y Grok-2mini

xAI, la empresa de Elon Musk, lanzó hoy las versiones beta de Grok-2 y Grok-2mini, dos nuevos modelos de IA con una mejora significativa en la capacidad de razonamiento, pero también con riesgos y desafíos potenciales. El nuevo Grok AI aportará una serie de nuevas funciones impulsadas por IA a la red social X, incluida la generación de imágenes.

image.png

【Resumen de AiBase:】

🚀 Grok-2 y Grok-2mini son actualizaciones importantes con avances innovadores en chat, codificación y razonamiento.

🔍 La función de generación de imágenes de Grok ha generado un gran interés, pero podría enfrentarse a presiones relacionadas con la difusión de información política falsa.

💡 xAI planea implementar varias funciones impulsadas por IA en la plataforma X, incluyendo mejoras en la función de búsqueda y el sistema de respuestas.

2. ¡A la altura de GPT-4o! Google presenta Gemini Live

Gemini Live es un asistente de IA generativa de Google que ofrece una mayor comodidad y una experiencia de interacción más humana. Puede conversar con los usuarios de forma fluida y natural, admite el uso manos libres, se integra con varias aplicaciones de Google y proporciona ayuda diaria. Gemini se integra completamente en la experiencia del usuario de Android y tiene capacidad de comprensión contextual. Google ha introducido el modelo Gemini 1.5 Flash para mejorar la velocidad y la calidad de respuesta. Gemini, como asistente predeterminado de Google Pixel 9, muestra el potencial y el desarrollo inteligente de los asistentes impulsados por IA.

【Resumen de AiBase:】

🤖 Gemini Live ofrece una experiencia de conversación fluida y natural, admite el uso manos libres, como un asistente de chat en tu bolsillo.

📱 Gemini se integra con varias aplicaciones de Google, ofreciendo ayuda diaria sin necesidad de cambiar entre diferentes aplicaciones.

⚡ Google ha introducido el modelo Gemini 1.5 Flash para mejorar la velocidad y la calidad de respuesta, optimizando continuamente la experiencia del usuario.

Enlace de detalles: https://blog.google/products/gemini/made-by-google-gemini-ai-updates/

3. ¡Con IA! Google lanza la serie de teléfonos Pixel 9: con chip Tensor G4 y compatibilidad con Gemini

Google ha lanzado la serie de teléfonos inteligentes Pixel 9, con el asistente de IA Gemini, que incorpora tecnología de inteligencia artificial de modelos lingüísticos grandes para mejorar la experiencia del usuario y el rendimiento del dispositivo. Los nuevos teléfonos cuentan con el chip Tensor G4, una gran capacidad de memoria y una potente capacidad de procesamiento de IA. Ofrecen un precio asequible y funciones completas. Gemini está profundamente integrado en el sistema Android, proporcionando funciones de capa superpuesta, y pronto se extenderá al sistema iOS. Se ha añadido la función SOS por satélite, que proporciona servicios de rescate de emergencia.

image.png

【Resumen de AiBase:】

📱 La serie Pixel 9 incluye Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL y Pixel 9 Pro Fold, con chip Tensor G4, gran capacidad de memoria y capacidad para satisfacer las necesidades de IA.

📸 La configuración de la cámara es de alta especificación, la versión Pro admite zoom óptico de 5x y zoom digital de 30x.

🚀 Gemini está profundamente integrado en el sistema Android, proporcionando funciones de capa superpuesta, y pronto se extenderá al sistema iOS.

4. Google lanza Pixel Studio, una aplicación de generación de imágenes a partir de texto con IA

La aplicación Pixel Studio, lanzada por Google, revolucionará la forma de crear y editar imágenes, destacando su capacidad de generar imágenes de diversos estilos en tan solo 2 segundos. Esta aplicación es práctica y potente, ofreciendo una amplia variedad de funciones de creación de imágenes, basada en el modelo Imagen3 y el chip Tensor G4 SoC, y admite la generación de modelos Gemini en la nube. A diferencia de sus competidores, las funciones de Pixel Studio están incluidas en el precio inicial de compra de los dispositivos de la serie Pixel 9, lo que le otorga una ventaja en el mercado.

【Resumen de Ai:】

🌟 Pixel Studio, basado en el modelo Imagen3, genera imágenes de varios estilos en 2 segundos.

🛠️ La aplicación incluye herramientas de edición con IA, que permiten una creación rápida e intuitiva de imágenes.

💰 Todas las funciones están incluidas sin costo adicional, mejorando la competitividad de la serie Pixel 9 en el mercado.

Enlace de detalles: https://top.aibase.com/tool/imagefx

5. Kuaishou lanza la aplicación de diálogo inteligente Feichuan

La aplicación de diálogo inteligente Feichuan (Kraft), lanzada por Kuaishou Technology, tiene como objetivo ofrecer a los usuarios una experiencia de interacción personalizada, permitiendo la interacción mediante texto o voz con personajes virtuales para satisfacer las necesidades de los usuarios, mejorando su calidad de vida y eficiencia laboral. La aplicación Feichuan se basa en el modelo Kuaiyi de Kuaishou, con una velocidad de respuesta rápida y una experiencia de voz realista, permitiendo a los usuarios personalizar sus personajes virtuales para crear una interacción personalizada y divertida.

image.png

【Resumen de AiBase:】

🚀 La aplicación Feichuan ofrece una experiencia de interacción personalizada, los usuarios pueden interactuar con personajes virtuales mediante texto o voz para responder preguntas, obtener entretenimiento y crear contenido.

👩‍✈️ Los usuarios en la plataforma Feichuan desempeñan el papel de capitán, guiados por una guía virtual llamada Kuai, lo que hace la experiencia más vívida e interesante.

💬 Las principales funciones de Feichuan incluyen diálogo de lenguaje natural, creación de personajes virtuales personalizados y asistencia para la creación de contenido, satisfaciendo las diversas necesidades de los usuarios.

Enlace de detalles: https://www.spaceshipapp.cn/#/

6. El navegador Opera One llega oficialmente al iPhone, ¡con funciones de IA para una experiencia totalmente nueva!

El navegador Opera One llega oficialmente a la plataforma iPhone, incorporando tecnología de IA para ofrecer a los usuarios una experiencia de navegación más inteligente. Los usuarios pueden utilizar las funciones de IA para realizar búsquedas más sencillas, comparar pestañas y consultar el historial de navegación, mejorando la eficiencia y la experiencia de los usuarios.

image.png

【Resumen de AiBase:】

🌟 El nuevo navegador Opera One ha implementado funciones de IA en iOS, mejorando la experiencia de búsqueda de los usuarios.

🛍️ La nueva función de "comparación de pestañas" hace que las compras online sean más eficientes, permitiendo a los usuarios comparar fácilmente la información de diferentes productos.

🔍 La función de búsqueda de historial impulsada por IA permite a los usuarios recuperar los sitios web visitados anteriormente simplemente haciendo una pregunta.

7. ChatGPT ya está utilizando silenciosamente el nuevo modelo GPT-4o

ChatGPT anunció discretamente en la red social X que ha comenzado a utilizar el nuevo modelo GPT-4o, actualizado según los comentarios de los usuarios. El nuevo modelo muestra un mejor rendimiento, puede realizar razonamientos más detallados y admite la generación de imágenes, mejorando la calidad y la eficiencia de la generación. Algunos usuarios han criticado la actualización, considerando que los cambios no son lo suficientemente significativos.

【Resumen de AiBase:】

🌟 Se ha lanzado el nuevo modelo GPT-4o, modificado en base a los comentarios de los usuarios.

🤖 Los usuarios han descubierto que el modelo tiene un mejor rendimiento y puede realizar razonamientos paso a paso más detallados.

🖼️ El nuevo modelo admite la generación de imágenes, mejorando la calidad y la eficiencia de la generación.

8. El navegador QQ de Tencent lanza la herramienta de asistencia educativa "Tutoría de redacción con IA"

La herramienta "Tutoría de redacción con IA", recientemente lanzada por Tencent, está disponible gratuitamente en el navegador QQ y ofrece a los estudiantes tutoría personalizada de redacción, abarcando todos los niveles desde primaria hasta secundaria. Los estudiantes pueden introducir el tema del ensayo, y la IA generará paso a paso la idea principal, el esquema, los materiales y un ejemplo, ayudando a construir la lógica de la escritura. Las funciones incluyen análisis del tema, varias opciones de idea principal, esquema y abundante material. Además de la tutoría de redacción, el navegador QQ también ofrece tutoría personalizada para todos los niveles educativos y potentes herramientas inteligentes para mejorar la eficiencia del aprendizaje y el trabajo de oficina.

image.png

【Resumen de AiBase:】

📚 La herramienta "Tutoría de redacción con IA" de Tencent está disponible gratuitamente en el navegador QQ y abarca todos los niveles educativos desde primaria hasta secundaria.

📝 Los estudiantes solo necesitan introducir el tema del ensayo, y la IA generará la idea principal, el esquema, los materiales y un ejemplo, ayudando a construir la lógica de la escritura.

💡 La función de tutoría de redacción con IA incluye análisis del tema, varias opciones de idea principal, esquema y abundante material, ofreciendo una experiencia de tutoría personalizada.

9. Google lanza la función "Add Me" para que ya no falte nadie en las fotos de grupo

En el evento Made By Google de este año, Google presentó la llamativa nueva función "Add Me", que combina IA y realidad aumentada para solucionar el problema de que el fotógrafo no aparezca en las fotos de grupo o de que se quiera incluir a la persona que toma la foto. Esta innovadora tecnología permite que todos participen en las fotos de grupo sin necesidad de pedir ayuda a desconocidos, cambiando la forma de tomar fotos de grupo.

【Resumen de AiBase:】

📸 Google lanza la función "Add Me", que utiliza IA y realidad aumentada para combinar dos fotos en una imagen perfecta.

🤳 El fotógrafo toma una foto sin él mismo, y otra persona toma otra foto. Pixel combina las dos fotos para asegurar que todos estén en la misma foto.

🔍 La función "Add Me" puede integrar perfectamente a una tercera persona en la foto de grupo, pero es mejor evitar movimientos demasiado grandes para evitar deformaciones en la composición.

10. Eleven Labs lanza un servicio de doblaje automático con IA totalmente gestionado

Eleven Labs lanza un servicio de doblaje automático con IA totalmente gestionado, ofreciendo a los creadores de contenido y a las empresas una solución innovadora para superar las barreras lingüísticas. Este servicio admite múltiples idiomas, ampliando el público objetivo del contenido de vídeo, y su capacidad para replicar la voz manteniendo las características personales originales mejora la autenticidad y la cercanía del contenido. Aunque la sincronización labial aún necesita mejoras, este servicio abre nuevas posibilidades para la producción de contenido multilingüe, reduciendo los costes asociados.

【Resumen de AiBase:】

🌐 La capacidad de admitir múltiples idiomas amplía el público objetivo y facilita la difusión intercultural.

🎙️ La capacidad de replicar la voz manteniendo las características personales originales mejora la autenticidad y la cercanía del contenido.

👩‍💼 El proceso de verificación por parte de locutores profesionales garantiza la calidad de la traducción y genera empatía en el público extranjero.

Enlace de detalles: https://top.aibase.com/tool/elevenlabs

11. ¡Con una tasa de éxito del 95,4%! Aparece Agent Q, ¿una nueva estrella en el mundo de la IA o un maestro del marketing con fresas?

Una startup llamada MultiOn ha lanzado el agente inteligente Agent Q, con una tasa de éxito del 95,4%, generando un gran interés. El CEO utiliza con frecuencia emojis de fresas, lo que evoca el proyecto Q de OpenAI. Agent Q combina la búsqueda, la autorreflexión y el aprendizaje por refuerzo, con capacidad de planificación y autocorrección. A pesar de su excelente rendimiento, aún hay mucho debate y margen de mejora.

image.png

【Resumen de AiBase:】