¡Bienvenido a la sección de 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentamos los temas más destacados del campo de la IA, con enfoque en los desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.
Conozca los nuevos productos de IA aquí: https://top.aibase.com/
1. Midjourney lanza la función de personalización de modelos
Midjourney ha lanzado recientemente una innovadora función de personalización de modelos que permite a los usuarios ajustar el modelo MJ según sus preferencias estéticas, para que las imágenes generadas se ajusten más a sus gustos personales. El modelo personalizado se logra analizando las imágenes que le gustan al usuario, aprendiendo su estética única y satisfaciendo su gusto. Los usuarios deben calificar o dar "me gusta" a al menos 200 imágenes. Después de habilitar la función de personalización, se debe agregar un código específico después del aviso para compartir el efecto personalizado.
【Resumen de AiBase:】
🎨 La función de personalización de modelos permite a los usuarios ajustar el modelo MJ según sus preferencias estéticas, para que las imágenes generadas se ajusten más a sus gustos personales.
🔍 El modelo personalizado analiza las imágenes que le gustan al usuario, aprende su estética única y mejora la precisión de las imágenes generadas.
💡 Los usuarios deben calificar o dar "me gusta" a al menos 200 imágenes. Después de habilitar la función de personalización, se debe agregar un código específico después del aviso para compartir el efecto personalizado.
Enlace de detalles: https://www.midjourney.com/rank
2. ComfyUI ya es compatible con el modelo SD3 Medium, que pronto será de código abierto
El modelo SD3 Medium estará pronto disponible de código abierto. Para prepararse para este importante momento, ComfyUI ya ha realizado el trabajo de adaptación y está listo para recibir el nuevo modelo. Los usuarios podrán experimentar una textura más realista, una mejor composición, un rendimiento superior y una capacidad de ajuste fino mejorada en la generación de imágenes.
【Resumen de AiBase:】
📈 El modelo SD3 Medium estará pronto disponible de código abierto, y ComfyUI ya es compatible.
🖼️ SD3 Medium ha logrado un progreso significativo en la generación de imágenes, capaz de generar imágenes ricas en detalles y altamente realistas.
💡 SD3 Medium tiene una gran capacidad para generar imágenes de alta calidad y ricas en detalles.
Detalles:
https://github.com/comfyanonymous/ComfyUI/commit/8c4a9befa7261b6fc78407ace90a57d21bfe631e
3. El método de entrada de WeChat está probando funciones de IA: solo necesita presionar esta tecla para obtener una respuesta de IA
La versión de prueba del método de entrada de WeChat ha agregado una función de asistente de IA. Presione "=" para obtener una respuesta generada por IA. Se admite la recomendación de emojis y caracteres de expresión facial. Se ha mejorado la compatibilidad con los formatos de entrada de fecha y hora.
【Resumen de AiBase:】
🤖 El método de entrada de WeChat ha agregado una función de asistente de IA. Presione "=" para obtener una respuesta generada por IA.
🤖 La actualización mejora la compatibilidad con emojis y caracteres de expresión facial, así como con los formatos de entrada de fecha y hora.
🤖 Actualmente, la versión beta solo está disponible para usuarios de Windows. Es posible que se lance en plataformas iOS, Android y Mac.
4. ByteDance lanza "Xiao Huangjiao", un producto de chat de citas virtuales con IA que puede generar fotos y simular conversaciones realistas
Recientemente, se lanzó un producto de chat de citas virtuales con IA llamado "Xiao Huangjiao" (nombre en inglés: Chatwiz). Su característica principal es la capacidad de generar fotos y simular conversaciones casi realistas. Se ha verificado que la entidad comercial del producto es Beijing Zhen Ding Technology Co., Ltd. (Tomato Novel), y su controlador real es ByteDance.
【Resumen de AiBase:】
⭐ Xiao Huangjiao es un producto de chat de citas virtuales con IA que puede generar fotos y simular conversaciones casi realistas.
⭐ ByteDance está invirtiendo activamente en modelos de IA de gran tamaño, lanzando varios productos y servicios de IA.
⭐ "Xiao Huangjiao" muestra la continua exploración e innovación de ByteDance en el campo de las aplicaciones de IA.
5. iFlytek: Lanzará iFlytek Xinghuo V4.0 el 27 de junio para mostrar las últimas tecnologías de voz inteligente
iFlytek lanzará iFlytek Xinghuo V4.0 el 27 de junio para mostrar los últimos logros en tecnología de voz inteligente de extremo a extremo, incluyendo la replicación de frases, el reconocimiento de voz en entornos ruidosos y la función de cambio sin interrupciones entre múltiples dialectos e idiomas. Liu Qingfeng reveló que iFlytek está a la vanguardia internacional en tecnología full-duplex y tecnología de síntesis de voz hiper-humana. En el futuro, iFlytek se centrará en la investigación y el desarrollo en áreas como escenarios de conversación multipersona en entornos ruidosos de campo lejano y escenarios personalizados de alta expresividad.
【Resumen de AiBase:】
🚀 iFlytek Xinghuo V4.0 mostrará los últimos logros en tecnología de voz inteligente de extremo a extremo, incluyendo la replicación de frases, el reconocimiento de voz en entornos ruidosos y la función de cambio sin interrupciones entre múltiples dialectos e idiomas.
💡 iFlytek está a la vanguardia internacional en tecnología full-duplex y tecnología de síntesis de voz hiper-humana.
🔮 En el futuro, iFlytek se centrará en la investigación y el desarrollo en áreas como escenarios de conversación multipersona en entornos ruidosos de campo lejano y escenarios personalizados de alta expresividad.
6. El precio de las acciones de Apple alcanza un máximo histórico después del anuncio de nuevas funciones de IA
El precio de las acciones de Apple subió más del 7% el martes al cierre, alcanzando un máximo histórico. Este repunte ofrece un rayo de esperanza para el rendimiento de Apple este año y demuestra la actitud positiva del mercado hacia las nuevas funciones de inteligencia artificial de Apple.
【Resumen de AiBase:】
📈 El precio de las acciones de Apple subió más del 7% el martes, alcanzando un máximo histórico. Su capitalización bursátil podría alcanzar los 3,18 billones de dólares, solo superada por Microsoft.
📱 Las nuevas funciones de inteligencia artificial han aumentado el atractivo de los dispositivos Apple, incluyendo un asistente virtual Siri mejorado y varias funciones de IA.
💡 Después del evento para desarrolladores, los analistas han elevado el precio objetivo de las acciones de Apple, y se espera que las nuevas funciones estimulen las compras de la nueva serie de iPhone en otoño.
7. Follow-Your-Emoji: Genera animaciones ricas en expresiones capturando los cambios en las expresiones faciales de las personas
Follow-Your-Emoji es una tecnología innovadora que genera nuevas animaciones faciales extrayendo las características faciales de las personas en un video. Esta tecnología captura con precisión las características faciales y los puntos de las pupilas, eliminando la interferencia del contorno facial, para lograr efectos de animación más naturales y vívidos. Tiene amplias aplicaciones y puede beneficiar a los sectores del entretenimiento, la educación y los negocios.
【Resumen de AiBase:】
👤 El usuario proporciona una foto y la tecnología genera una animación de video, capturando los sutiles cambios en las expresiones faciales.
🔒 Se mantiene la identidad, las características de identidad de referencia del avatar se conservan y no se pierden.
😊 Expresiones ricas, genera varias expresiones, incluyendo el movimiento de las pupilas, haciendo que la animación sea más vívida y realista.
Enlace de detalles: https://top.aibase.com/tool/follow-your-emoji
8. Editor de imágenes con IA en línea Freepik Designer
Freepik Designer es un innovador editor de imágenes con IA en línea que proporciona a los usuarios herramientas de diseño fáciles de usar, sin necesidad de conocimientos profesionales de diseño para un inicio rápido. La integración de sus herramientas de IA hace que el proceso de diseño sea más eficiente, y también ofrece una amplia biblioteca de plantillas para satisfacer diferentes necesidades de diseño.
【Resumen de AiBase:】
🎨 Herramientas de diseño fáciles de usar, sin necesidad de conocimientos profesionales de diseño para un inicio rápido.
🖼️ Ofrece una amplia biblioteca de plantillas para satisfacer diferentes necesidades de diseño.
💡 Integración de herramientas de IA, mejora la eficiencia y la calidad del diseño.
Enlace de detalles: https://top.aibase.com/tool/freepik-designer
9. Elon Musk retira su demanda contra OpenAI
Elon Musk retiró su demanda contra OpenAI, acusándola de incumplimiento de contrato. Musk argumenta que OpenAI abandonó su misión sin fines de lucro y se ha orientado hacia los intereses comerciales. OpenAI niega las acusaciones, calificándolas de "incoherentes" y "absurdas".
【Resumen de AiBase:】
🔍 Elon Musk retira su demanda contra OpenAI.
💡 Musk acusa a OpenAI de abandonar su misión sin fines de lucro y de orientarse hacia los intereses comerciales.
🔒 OpenAI niega las acusaciones, calificándolas de "incoherentes" y "absurdas".
10. La herramienta de código abierto YaFSDP de Yandex supera los cuellos de botella en la eficiencia del entrenamiento de LLM
La herramienta YaFSDP de código abierto de Yandex ofrece al comunidad mundial de IA un método innovador para optimizar el entrenamiento de LLM, mejorando significativamente la velocidad de entrenamiento y ahorrando una gran cantidad de recursos de GPU, haciendo que el entrenamiento autónomo de LLM sea más viable. Yandex se compromete a contribuir continuamente al desarrollo de la comunidad mundial de IA, y la publicación de YaFSDP de código abierto es una muestra de este compromiso.
【Resumen de AiBase:】
✨ YaFSDP es un método de optimización de entrenamiento de modelos de lenguaje de gran tamaño de código abierto de Yandex que puede mejorar la velocidad de entrenamiento de LLM en un 26%.
💡 YaFSDP se centra en optimizar la eficiencia de la comunicación de GPU y el uso de la memoria, mostrando un rendimiento excelente cuando el tamaño de los parámetros de entrenamiento alcanza los 300 millones a 700 millones.
🌟 El entrenamiento de un modelo de 700 millones de parámetros con YaFSDP puede ahorrar aproximadamente 150 GPU, con un ahorro de costes de entre 500.000 y 1.500.000 dólares.
11. ¡Aumento de velocidad de 410 veces! TikTok solo necesita 32 tokens para reconstruir y generar imágenes
Recientemente, el desarrollo de modelos generativos ha puesto de manifiesto el papel clave de la tokenización de imágenes en la síntesis eficiente de imágenes de alta resolución. TikTok es un marco de tokenización unidimensional basado en Transformer que tokeniza imágenes en secuencias latentes unidimensionales, mejorando enormemente la eficiencia y la calidad de la generación. Se destaca en el procesamiento de imágenes de alta resolución, con una velocidad de generación significativamente mayor, al tiempo que mantiene una salida de muestras de alta calidad.
【Resumen de AiBase:】
⚙️ La tokenización de imágenes reduce las necesidades computacionales, mejorando la eficiencia y la eficacia de la generación.
🔍 TikTok tokeniza imágenes en secuencias latentes unidimensionales, utilizando tan solo 32 tokens discretos para representar una imagen de 256×256.
💡 TikTok muestra un rendimiento excelente en las pruebas de referencia de ImageNet, con una velocidad de generación 410 veces mayor, al tiempo que mantiene una salida de muestras de alta calidad.
12. El MIT desarrolla un nuevo algoritmo, DenseAV: aprende el significado del lenguaje viendo videos
En el nuevo algoritmo DenseAV desarrollado por el MIT, los investigadores utilizan la comprensión de la máquina de la forma en que los animales se comunican para aprender el significado del lenguaje viendo videos. Este algoritmo puede aprender de forma no supervisada el significado de las palabras y la ubicación de los sonidos, logrando una distinción natural de la conexión entre modalidades cruzadas. El equipo espera aplicarlo a la comprensión de nuevos idiomas y al descubrimiento de patrones de asociación entre diferentes señales.
【Resumen de AiBase:】
🧠 DenseAV es una arquitectura de codificador doble basada en tierra que aprende características de alta resolución, significado semántico y alineación audiovisual.
🔍 El aprendizaje no supervisado descubre la asociación entre el significado de las palabras y la ubicación del sonido, distinguiendo automáticamente el lenguaje y el sonido.
🌐 Supera a los modelos anteriores como ImageBind en la recuperación de modalidades cruzadas, y se aplica al aprendizaje de una gran cantidad de videos y a la comprensión de nuevos idiomas.
Enlace de detalles: https://top.aibase.com/tool/denseav
13. Hacer que la IA sea más ética: Source.Plus proporciona datos de entrenamiento de IA de alta calidad
Spawning se dedica a proporcionar a los artistas un mayor control sobre el uso en línea de sus obras. El proyecto Source.Plus ha lanzado un conjunto de datos que contiene cerca de 40 millones de imágenes de dominio público e imágenes con licencia Creative Commons CC0, proporcionando datos de alta calidad para el entrenamiento de modelos de IA. Esta plataforma ofrece a los artistas y creadores una gestión más precisa de los permisos de uso de sus obras, inyectando nueva vitalidad al desarrollo y aplicación de la tecnología de IA.
【Resumen de AiBase:】
🔍 Búsqueda y organización de datos: los usuarios pueden buscar rápidamente varios datos multimedia y organizarlos y etiquetarlos para satisfacer las necesidades de entrenamiento.
🌟 Datos de entrenamiento de alta calidad: los datos filtrados y revisados garantizan la seguridad y la calidad, y su uso es legal y consentido.
💡 Amplias aplicaciones: adecuado para el entrenamiento de varios modelos de IA, mejorando la precisión y la robustez.
Enlace de detalles: https://top.aibase.com/tool/source-plusSource.Plus