¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentamos los temas más relevantes del campo de la IA, con enfoque en los desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de los productos de IA.

Nuevos productos de IA ¡Descubra más!

1、Kolors Virtual Try-On: Pruébate ropa con un solo clic

Me encanta este artículo sobre Kolors Virtual Try-On, una aplicación que facilita las compras. Subiendo una foto, los usuarios pueden probarse virtualmente diferentes estilos, evitando problemas de talla y color, y disfrutando de una experiencia de moda personalizada. Esta tecnología de vanguardia no solo mejora la precisión y la eficiencia de las compras, sino que también las hace más divertidas.

image.png

【Resumen de AiBase:】

👗 Los usuarios pueden probarse ropa fácilmente desde casa, evitando problemas de talla y color.

📊 La aplicación ofrece un probador virtual para que los usuarios vean al instante cómo les queda la ropa, mejorando la precisión y la eficiencia de las compras.

💡 Los comerciantes pueden utilizar los datos de prueba de los usuarios para comprender las tendencias del mercado y las preferencias de los consumidores, optimizando sus líneas de productos y estrategias de marketing.

Enlace de detalles: https://top.aibase.com/tool/kolors-virtual-try-on

2、xAI Grok-2 se sitúa en el segundo lugar de la clasificación de chatbots, pisándole los talones a GPT-4o

Los modelos Grok-2 y Grok-Mini del equipo xAI destacaron en la clasificación LMSys Chatbot Arena. Grok-2 obtuvo el segundo lugar, superando a GPT-4o de OpenAI y empatando con Gemini. Grok-2 sobresalió en tareas matemáticas, obteniendo el primer lugar, y también obtuvo excelentes resultados en varias otras tareas. Grok-2-Mini logró una mejora significativa en la velocidad, el doble que antes.

【Resumen de AiBase:】

✨ Grok-2 obtuvo el segundo lugar en la clasificación LMSys Chatbot Arena, superando a GPT-4o y empatando con Gemini.

🚀 Grok-2 obtuvo excelentes resultados en tareas matemáticas, alcanzando el primer lugar, y también ocupó los primeros puestos en otras tareas.

💡 Grok-2-Mini mejoró su velocidad al doble, aumentando aún más su rendimiento.

3、¡Claude3.5 lo hizo posible! Un estudiante universitario construye un reactor de fusión nuclear en miniatura en su dormitorio con la ayuda de la IA

Este artículo cuenta la historia de Hudhayfa, un estudiante universitario de matemáticas de la generación Z, que construyó con éxito un reactor de fusión nuclear en miniatura en su dormitorio con la ayuda del asistente de inteligencia artificial Claude3.5. Su determinación y la ayuda de su asistente de IA le permitieron superar la falta de experiencia en hardware, demostrando la capacidad de realizar sueños tecnológicos.

image.png

【Resumen de AiBase:】

🤖 Hudhayfa construyó con éxito un reactor de fusión nuclear en miniatura con la ayuda del asistente de IA Claude3.5, demostrando la capacidad de realizar sueños tecnológicos.

🔧 Hudhayfa completó la construcción siguiendo pasos como familiarizarse con los componentes, diseñar la cámara principal y ensamblar el convertidor de media onda.

⚛️ Hudhayfa encontró desafíos en el experimento, pero recibió ayuda de ingenieros e instructores de alto nivel, lo que proporciona una dirección para futuras mejoras.

Contenido detallado: https://www.aibase.com/zh/news/11281

4、Apple está desarrollando un brazo robótico con IA generativa, que podría cambiar la experiencia del hogar inteligente

Apple entra oficialmente en el mercado de la robótica, planeando lanzar un dispositivo de escritorio con IA generativa, que se espera que salga al mercado en 2026 o 2027. Esta iniciativa revolucionará el hogar inteligente, ofreciendo a los usuarios una experiencia de vida más cómoda.

【Resumen de AiBase:】

🌟 Apple planea lanzar un dispositivo de escritorio con IA generativa, que estará disponible en 2026 o 2027.

🤖 El dispositivo estará equipado con un brazo robótico que podrá resolver problemas cotidianos, como girar la pantalla automáticamente.

🚀 Si tiene éxito, Apple podría desarrollar aún más robots móviles y robots humanoides.

5、Unisound lanza el modelo multimodal Shanhai: admite el cambio libre de timbre y la comprensión de escenas visuales

Unisound lanza el modelo multimodal Shanhai, inyectando nueva vitalidad al campo de la inteligencia artificial. Este modelo ha logrado la entrada y salida multimodales, proporcionando una interacción de voz fluida y una experiencia visual personalizada. Tiene un significado importante en los campos de la vida inteligente y la atención médica inteligente.

image.png

【Resumen de AiBase:】

🔊 El modelo multimodal Shanhai admite múltiples entradas modales como texto, audio e imágenes, y cualquier combinación de salidas, lo que permite una interacción de voz eficiente.

👥 El modelo tiene capacidades de interacción de voz inteligente, admite la expresión emocional y el cambio libre de timbre, proporcionando una experiencia personalizada.

👁️ El modelo puede comprender el entorno, reconocer objetos y crear contenido visual a través de la cámara, logrando un análisis de escena preciso y una experiencia visual personalizada.

Enlace de detalles: https://shanhai.unisound.com/

6、Google presiona a los editores a elegir: ¡o se unen a las respuestas de IA o pierden la visibilidad!

Google, utilizando su ventaja en el mercado de motores de búsqueda, obliga a los editores a una difícil decisión: participar en las respuestas de IA o arriesgarse a perder la visibilidad en las búsquedas. Esta situación deja a muchos editores confundidos e impotentes.

【Resumen de AiBase:】

🔍 Google utiliza su ventaja de mercado para presionar a los editores a elegir entre participar en las respuestas de IA o arriesgarse a perder la visibilidad en las búsquedas.

🚫 Los editores pueden usar la etiqueta "nosnippet" para evitar que su contenido se utilice en las respuestas de IA, pero esto puede afectar su clasificación general en las búsquedas.

💰 Google ha dejado de negociar con los editores sobre las licencias de uso de contenido, y las empresas de IA intentan resolver el problema mediante compensaciones.

7、Una empresa de juegos coreana lanza el juego de crianza virtual 《inZOI》: la magia de la IA permite una conexión perfecta entre la realidad y lo virtual

《inZOI》es un juego revolucionario que, mediante la tecnología de IA, logra una conexión perfecta entre la realidad y lo virtual, permitiendo a los jugadores disfrutar de una libertad creativa y una experiencia personalizada sin precedentes. El juego abre nuevas posibilidades, ofreciendo a los jugadores una plataforma para liberar su creatividad.

【Resumen de AiBase:】

✨ El juego tiene una capacidad mágica de conversión de 2D a 3D, permitiendo a los jugadores integrar objetos reales en el escenario del juego, rompiendo los límites entre la realidad y lo virtual.

🏡 Ofrece una plataforma de construcción totalmente libre, permitiendo a los jugadores crear el hogar de sus sueños, desde los detalles hasta los muebles, diseñados por el jugador, mostrando su creatividad personalizada.

😃 Las revolucionarias herramientas de captura de movimiento capturan en tiempo real las expresiones faciales del jugador, mapeándolas con precisión en el personaje del juego, creando una experiencia de personaje única.

8、Meta lanza el modelo de análisis visual Sapien

Meta Reality Labs lanzó recientemente un modelo de inteligencia artificial llamado "Sapiens", entrenado en más de 300 millones de imágenes humanas, mostrando una capacidad excepcional para manejar tareas de visión humana en entornos complejos. Sapiens utiliza métodos avanzados, incluyendo el preentrenamiento de conjuntos de datos a gran escala, la arquitectura de transformadores visuales y el aprendizaje multitarea, con un amplio rango de aplicaciones potenciales. Los resultados experimentales muestran que Sapiens exhibe alta precisión y consistencia en múltiples tareas.

image.png

【Resumen de AiBase:】

🔍 El modelo Sapiens ha logrado un gran avance en el procesamiento de tareas de visión humana, pudiendo reconocer con precisión la postura humana y predecir la información de profundidad.

🚀 Sapiens utiliza el preentrenamiento de conjuntos de datos a gran escala y la arquitectura de transformadores visuales, mostrando una poderosa capacidad de generalización y capacidad de inferencia de alta resolución.

💡 Sapiens tiene amplias aplicaciones en videovigilancia, atención médica, redes sociales y realidad virtual, mejorando la captura de movimiento, la asistencia médica y la experiencia del usuario.

Enlace de detalles: https://about.meta.com/realitylabs/codecavatars/sapiens

9、Xinchen Lingo: El primer modelo de lenguaje de voz de extremo a extremo de China

Xinchen Lingo es el primer sistema de IA de China con capacidades de voz que igualan a las de GPT-4, marcando un gran avance en el campo de la IA de voz en China. Este modelo cuenta con tres ventajas principales: comprensión de voz nativa, expresión de estilos de voz diversos y compresión eficiente de modalidades de voz, ofreciendo a los usuarios una experiencia de interacción más natural y vívida.

image.png

【Resumen de AiBase:】

🌟 La comprensión de voz nativa, la expresión de estilos de voz diversos y la compresión eficiente de modalidades de voz son las tres principales ventajas de Xinchen Lingo.

🚀 Xinchen Lingo puede ajustar flexiblemente el estilo de voz para adaptarse a diferentes escenarios de aplicación, proporcionando una experiencia de interacción de voz completa y fluida.

💡 Xinchen Lingo integra un flujo de interacción completo, proporcionando a los usuarios contenido de voz de alta calidad, y se espera que desempeñe un papel importante en campos como asistentes inteligentes, interacción de voz y formación educativa.

Enlace de detalles: https://lingo.xinchenai.com/

10、La selección de acciones con IA resulta decepcionante: la mayoría de los fondos tienen un rendimiento inferior al índice S&P 500

La IA no ha tenido un buen desempeño en el mercado de valores. La mayoría de los fondos cotizados en bolsa (ETF) que dependen de la IA tienen un rendimiento inferior al índice S&P 500. Los estudios muestran que los fondos que dependen completamente de la IA han perdido un 1,8% anual de media, sin obtener beneficios en un mercado generalmente al alza. Si bien la IA puede encontrar patrones de datos, aún no comprende el significado real detrás de los datos.

【Resumen de AiBase:】

🌟 La mayoría de los fondos cotizados en bolsa (ETF) que dependen de la IA tienen un rendimiento inferior al índice S&P 500.

📉 Los fondos que dependen completamente de la IA han perdido un 1,8% anual de media, sin obtener beneficios en un mercado generalmente al alza.

🤖 Si bien la IA puede encontrar patrones de datos, aún no comprende el significado real detrás de los datos.

11、¡Nueva investigación de Fudan! RECE: la “técnica de borrado de memoria” del mundo de la IA: hace que las imágenes inapropiadas desaparezcan

El equipo de investigación de la Universidad de Fudan ha desarrollado la técnica de borrado conceptual (RECE), que revoluciona la IA y hace que las imágenes inapropiadas sean cosa del pasado. Esta tecnología de vanguardia puede transformar completamente el pensamiento de la IA en tan solo 3 segundos, de forma precisa y eficiente. Los expertos temen que la creatividad de la IA pueda verse afectada, pero la tecnología abre nuevas vías para el futuro desarrollo de la IA, haciéndola más inteligente y perspicaz.

【Resumen de AiBase:】

🧹 La técnica de borrado conceptual (RECE) transforma completamente el pensamiento de la IA, eliminando la generación de imágenes inapropiadas.

🎨 El equipo de investigación utiliza una solución cerrada para modificar con precisión los modelos de IA, manteniendo su capacidad creativa.

💡 La tecnología RECE abre nuevas vías para el futuro desarrollo de la IA, haciéndola más inteligente y perspicaz.

Enlace de detalles: https://arxiv.org/pdf/2407.12383

12、Moore Threads lanza el modelo de lenguaje de audio de código abierto MooER

Moore Threads ha lanzado el modelo de lenguaje de audio de código abierto MooER, mostrando sus últimos logros en el campo de la inteligencia artificial. Este modelo completó su entrenamiento en poco tiempo y mostró excelentes capacidades de reconocimiento y traducción de voz. A través del proyecto de código abierto, se proporciona a los desarrolladores una valiosa referencia y soporte.

image.png

【Resumen de AiBase:】

🔍 MooER es el primer gran modelo de lenguaje de voz de código abierto del sector basado en GPU de funciones completas de fabricación nacional para entrenamiento e inferencia.

💡 MooER tiene capacidades de reconocimiento de voz en chino e inglés, así como traducción de voz del chino al inglés.

🚀 MooER supera a otros modelos de código abierto en conjuntos de pruebas en chino e inglés.

Enlace de detalles: https://github.com/MooreThreads/MooER

13、Cambios de personal: OpenAI nombra a una ex ejecutiva de Meta para supervisar la planificación estratégica

OpenAI ha realizado un nombramiento reciente. Irina Kofman, ex ejecutiva de Meta, se unió como supervisora de planificación estratégica, centrándose en mejorar la seguridad y la preparación de la IA. La empresa está reclutando activamente ejecutivos para mejorar su competitividad, y también hay cambios en la salida de ejecutivos. La actualización recientemente lanzada de GPT-4o permite a los desarrolladores ajustar los modelos de IA a las necesidades específicas de su negocio, mejorando el rendimiento y creando herramientas de IA más adecuadas a sus necesidades.

【Resumen de AiBase:】

👩‍💼 Irina Kofman se unió a OpenAI como supervisora de planificación estratégica, centrándose en mejorar la seguridad y la preparación de la IA.

🔥 La empresa está reclutando activamente ejecutivos para mejorar su competitividad, y también hay cambios en la salida de ejecutivos.