Boletín diario de IA: MJ lanza función de personalización de modelos; ComfyUI se adapta al modelo SD3 Medium; ByteDance lanza la aplicación de citas con IA "Xiao Huangjiao"; El método de entrada de WeChat prueba funciones de IA

¡Bienvenido a la sección de 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentamos los temas más destacados del campo de la IA, con enfoque en los desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Conozca los nuevos productos de IA aquí: https://top.aibase.com/

1. Midjourney lanza la función de personalización de modelos

Midjourney ha lanzado recientemente una innovadora función de personalización de modelos que permite a los usuarios ajustar el modelo MJ según sus preferencias estéticas, para que las imágenes generadas se ajusten más a sus gustos personales. El modelo personalizado se logra analizando las imágenes que le gustan al usuario, aprendiendo su estética única y satisfaciendo su gusto. Los usuarios deben calificar o dar "me gusta" a al menos 200 imágenes. Después de habilitar la función de personalización, se debe agregar un código específico después del aviso para compartir el efecto personalizado.

【Resumen de AiBase:】
🎨 La función de personalización de modelos permite a los usuarios ajustar el modelo MJ según sus preferencias estéticas, para que las imágenes generadas se ajusten más a sus gustos personales.
🔍 El modelo personalizado analiza las imágenes que le gustan al usuario, aprende su estética única y mejora la precisión de las imágenes generadas.
💡 Los usuarios deben calificar o dar "me gusta" a al menos 200 imágenes. Después de habilitar la función de personalización, se debe agregar un código específico después del aviso para compartir el efecto personalizado.
Enlace de detalles: https://www.midjourney.com/rank

2. ComfyUI ya es compatible con el modelo SD3 Medium, que pronto será de código abierto

El modelo SD3 Medium estará pronto disponible de código abierto. Para prepararse para este importante momento, ComfyUI ya ha realizado el trabajo de adaptación y está listo para recibir el nuevo modelo. Los usuarios podrán experimentar una textura más realista, una mejor composición, un rendimiento superior y una capacidad de ajuste fino mejorada en la generación de imágenes.

QQ截图20240611174410.jpg

【Resumen de AiBase:】
📈 El modelo SD3 Medium estará pronto disponible de código abierto, y ComfyUI ya es compatible.
🖼️ SD3 Medium ha logrado un progreso significativo en la generación de imágenes, capaz de generar imágenes ricas en detalles y altamente realistas.
💡 SD3 Medium tiene una gran capacidad para generar imágenes de alta calidad y ricas en detalles.
Detalles:
https://github.com/comfyanonymous/ComfyUI/commit/8c4a9befa7261b6fc78407ace90a57d21bfe631e

3. El método de entrada de WeChat está probando funciones de IA: solo necesita presionar esta tecla para obtener una respuesta de IA

La versión de prueba del método de entrada de WeChat ha agregado una función de asistente de IA. Presione "=" para obtener una respuesta generada por IA. Se admite la recomendación de emojis y caracteres de expresión facial. Se ha mejorado la compatibilidad con los formatos de entrada de fecha y hora.

【Resumen de AiBase:】
🤖 El método de entrada de WeChat ha agregado una función de asistente de IA. Presione "=" para obtener una respuesta generada por IA.
🤖 La actualización mejora la compatibilidad con emojis y caracteres de expresión facial, así como con los formatos de entrada de fecha y hora.
🤖 Actualmente, la versión beta solo está disponible para usuarios de Windows. Es posible que se lance en plataformas iOS, Android y Mac.

4. ByteDance lanza "Xiao Huangjiao", un producto de chat de citas virtuales con IA que puede generar fotos y simular conversaciones realistas

Recientemente, se lanzó un producto de chat de citas virtuales con IA llamado "Xiao Huangjiao" (nombre en inglés: Chatwiz). Su característica principal es la capacidad de generar fotos y simular conversaciones casi realistas. Se ha verificado que la entidad comercial del producto es Beijing Zhen Ding Technology Co., Ltd. (Tomato Novel), y su controlador real es ByteDance.

QQ截图20240611160830.jpg

【Resumen de AiBase:】
⭐ Xiao Huangjiao es un producto de chat de citas virtuales con IA que puede generar fotos y simular conversaciones casi realistas.
⭐ ByteDance está invirtiendo activamente en modelos de IA de gran tamaño, lanzando varios productos y servicios de IA.
⭐ "Xiao Huangjiao" muestra la continua exploración e innovación de ByteDance en el campo de las aplicaciones de IA.

5. iFlytek: Lanzará iFlytek Xinghuo V4.0 el 27 de junio para mostrar las últimas tecnologías de voz inteligente

iFlytek lanzará iFlytek Xinghuo V4.0 el 27 de junio para mostrar los últimos logros en tecnología de voz inteligente de extremo a extremo, incluyendo la replicación de frases, el reconocimiento de voz en entornos ruidosos y la función de cambio sin interrupciones entre múltiples dialectos e idiomas. Liu Qingfeng reveló que iFlytek está a la vanguardia internacional en tecnología full-duplex y tecnología de síntesis de voz hiper-humana. En el futuro, iFlytek se centrará en la investigación y el desarrollo en áreas como escenarios de conversación multipersona en entornos ruidosos de campo lejano y escenarios personalizados de alta expresividad.

【Resumen de AiBase:】
🚀 iFlytek Xinghuo V4.0 mostrará los últimos logros en tecnología de voz inteligente de extremo a extremo, incluyendo la replicación de frases, el reconocimiento de voz en entornos ruidosos y la función de cambio sin interrupciones entre múltiples dialectos e idiomas.
💡 iFlytek está a la vanguardia internacional en tecnología full-duplex y tecnología de síntesis de voz hiper-humana.
🔮 En el futuro, iFlytek se centrará en la investigación y el desarrollo en áreas como escenarios de conversación multipersona en entornos ruidosos de campo lejano y escenarios personalizados de alta expresividad.

6. El precio de las acciones de Apple alcanza un máximo histórico después del anuncio de nuevas funciones de IA

El precio de las acciones de Apple subió más del 7% el martes al cierre, alcanzando un máximo histórico. Este repunte ofrece un rayo de esperanza para el rendimiento de Apple este año y demuestra la actitud positiva del mercado hacia las nuevas funciones de inteligencia artificial de Apple.

【Resumen de AiBase:】
📈 El precio de las acciones de Apple subió más del 7% el martes, alcanzando un máximo histórico. Su capitalización bursátil podría alcanzar los 3,18 billones de dólares, solo superada por Microsoft.
📱 Las nuevas funciones de inteligencia artificial han aumentado el atractivo de los dispositivos Apple, incluyendo un asistente virtual Siri mejorado y varias funciones de IA.
💡 Después del evento para desarrolladores, los analistas han elevado el precio objetivo de las acciones de Apple, y se espera que las nuevas funciones estimulen las compras de la nueva serie de iPhone en otoño.

7. Follow-Your-Emoji: Genera animaciones ricas en expresiones capturando los cambios en las expresiones faciales de las personas

Follow-Your-Emoji es una tecnología innovadora que genera nuevas animaciones faciales extrayendo las características faciales de las personas en un video. Esta tecnología captura con precisión las características faciales y los puntos de las pupilas, eliminando la interferencia del contorno facial, para lograr efectos de animación más naturales y vívidos. Tiene amplias aplicaciones y puede beneficiar a los sectores del entretenimiento, la educación y los negocios.

【Resumen de AiBase:】
👤 El usuario proporciona una foto y la tecnología genera una animación de video, capturando los sutiles cambios en las expresiones faciales.
🔒 Se mantiene la identidad, las características de identidad de referencia del avatar se conservan y no se pierden.
😊 Expresiones ricas, genera varias expresiones, incluyendo el movimiento de las pupilas, haciendo que la animación sea más vívida y realista.
Enlace de detalles: https://top.aibase.com/tool/follow-your-emoji

8. Editor de imágenes con IA en línea Freepik Designer

Freepik Designer es un innovador editor de imágenes con IA en línea que proporciona a los usuarios herramientas de diseño fáciles de usar, sin necesidad de conocimientos profesionales de diseño para un inicio rápido. La integración de sus herramientas de IA hace que el proceso de diseño sea más eficiente, y también ofrece una amplia biblioteca de plantillas para satisfacer diferentes necesidades de diseño.

【Resumen de AiBase:】
🎨 Herramientas de diseño fáciles de usar, sin necesidad de conocimientos profesionales de diseño para un inicio rápido.
🖼️ Ofrece una amplia biblioteca de plantillas para satisfacer diferentes necesidades de diseño.
💡 Integración de herramientas de IA, mejora la eficiencia y la calidad del diseño.
Enlace de detalles: https://top.aibase.com/tool/freepik-designer

9. Elon Musk retira su demanda contra OpenAI

Elon Musk retiró su demanda contra OpenAI, acusándola de incumplimiento de contrato. Musk argumenta que OpenAI abandonó su misión sin fines de lucro y se ha orientado hacia los intereses comerciales. OpenAI niega las acusaciones, calificándolas de "incoherentes" y "absurdas".

【Resumen de AiBase:】
🔍 Elon Musk retira su demanda contra OpenAI.
💡 Musk acusa a OpenAI de abandonar su misión sin fines de lucro y de orientarse hacia los intereses comerciales.
🔒 OpenAI niega las acusaciones, calificándolas de "incoherentes" y "absurdas".

10. La herramienta de código abierto YaFSDP de Yandex supera los cuellos de botella en la eficiencia del entrenamiento de LLM

La herramienta YaFSDP de código abierto de Yandex ofrece al comunidad mundial de IA un método innovador para optimizar el entrenamiento de LLM, mejorando significativamente la velocidad de entrenamiento y ahorrando una gran cantidad de recursos de GPU, haciendo que el entrenamiento autónomo de LLM sea más viable. Yandex se compromete a contribuir continuamente al desarrollo de la comunidad mundial de IA, y la publicación de YaFSDP de código abierto es una muestra de este compromiso.

【Resumen de AiBase:】
✨ YaFSDP es un método de optimización de entrenamiento de modelos de lenguaje de gran tamaño de código abierto de Yandex que puede mejorar la velocidad de entrenamiento de LLM en un 26%.
💡 YaFSDP se centra en optimizar la eficiencia de la comunicación de GPU y el uso de la memoria, mostrando un rendimiento excelente cuando el tamaño de los parámetros de entrenamiento alcanza los 300 millones a 700 millones.
🌟 El entrenamiento de un modelo de 700 millones de parámetros con YaFSDP puede ahorrar aproximadamente 150 GPU, con un ahorro de costes de entre 500.000 y 1.500.000 dólares.

11. ¡Aumento de velocidad de 410 veces! TikTok solo necesita 32 tokens para reconstruir y generar imágenes

Recientemente, el desarrollo de modelos generativos ha puesto de manifiesto el papel clave de la tokenización de imágenes en la síntesis eficiente de imágenes de alta resolución. TikTok es un marco de tokenización unidimensional basado en Transformer que tokeniza imágenes en secuencias latentes unidimensionales, mejorando enormemente la eficiencia y la calidad de la generación. Se destaca en el procesamiento de imágenes de alta resolución, con una velocidad de generación significativamente mayor, al tiempo que mantiene una salida de muestras de alta calidad.

【Resumen de AiBase:】
⚙️ La tokenización de imágenes reduce las necesidades computacionales, mejorando la eficiencia y la eficacia de la generación.
🔍 TikTok tokeniza imágenes en secuencias latentes unidimensionales, utilizando tan solo 32 tokens discretos para representar una imagen de 256×256.
💡 TikTok muestra un rendimiento excelente en las pruebas de referencia de ImageNet, con una velocidad de generación 410 veces mayor, al tiempo que mantiene una salida de muestras de alta calidad.

12. El MIT desarrolla un nuevo algoritmo, DenseAV: aprende el significado del lenguaje viendo videos

En el nuevo algoritmo DenseAV desarrollado por el MIT, los investigadores utilizan la comprensión de la máquina de la forma en que los animales se comunican para aprender el significado del lenguaje viendo videos. Este algoritmo puede aprender de forma no supervisada el significado de las palabras y la ubicación de los sonidos, logrando una distinción natural de la conexión entre modalidades cruzadas. El equipo espera aplicarlo a la comprensión de nuevos idiomas y al descubrimiento de patrones de asociación entre diferentes señales.

【Resumen de AiBase:】
🧠 DenseAV es una arquitectura de codificador doble basada en tierra que aprende características de alta resolución, significado semántico y alineación audiovisual.
🔍 El aprendizaje no supervisado descubre la asociación entre el significado de las palabras y la ubicación del sonido, distinguiendo automáticamente el lenguaje y el sonido.
🌐 Supera a los modelos anteriores como ImageBind en la recuperación de modalidades cruzadas, y se aplica al aprendizaje de una gran cantidad de videos y a la comprensión de nuevos idiomas.
Enlace de detalles: https://top.aibase.com/tool/denseav

13. Hacer que la IA sea más ética: Source.Plus proporciona datos de entrenamiento de IA de alta calidad

Spawning se dedica a proporcionar a los artistas un mayor control sobre el uso en línea de sus obras. El proyecto Source.Plus ha lanzado un conjunto de datos que contiene cerca de 40 millones de imágenes de dominio público e imágenes con licencia Creative Commons CC0, proporcionando datos de alta calidad para el entrenamiento de modelos de IA. Esta plataforma ofrece a los artistas y creadores una gestión más precisa de los permisos de uso de sus obras, inyectando nueva vitalidad al desarrollo y aplicación de la tecnología de IA.

【Resumen de AiBase:】
🔍 Búsqueda y organización de datos: los usuarios pueden buscar rápidamente varios datos multimedia y organizarlos y etiquetarlos para satisfacer las necesidades de entrenamiento.
🌟 Datos de entrenamiento de alta calidad: los datos filtrados y revisados garantizan la seguridad y la calidad, y su uso es legal y consentido.
💡 Amplias aplicaciones: adecuado para el entrenamiento de varios modelos de IA, mejorando la precisión y la robustez.
Enlace de detalles: https://top.aibase.com/tool/source-plusSource.Plus

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Boletín diario de IA: MJ lanza función de personalización de modelos; ComfyUI se adapta al modelo SD3 Medium; ByteDance lanza la aplicación de citas con IA "Xiao Huangjiao"; El método de entrada de WeChat prueba funciones de IA

站长之家

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

El estudio revela que el uso de la IA nos hace sobreestimar nuestras capacidades cognitivas

El CEO de OpenAI anuncia: 2028, lograr un investigador de IA completamente automático

OpenAI planea invertir 1 billón de dólares anuales para impulsar la infraestructura

Sequoia Capital invertirá en Rogo Technologies; la herramienta de inteligencia artificial podría revolucionar el rol del banquero junior

Australia denuncia a Microsoft por engañar a los usuarios de Microsoft 365 sobre las opciones de suscripción a Copilot

Chongqing refuerza la supervisión y retira más de 10 productos de IA no autorizados para garantizar la seguridad tecnológica

La preocupación de los estadounidenses por la inteligencia artificial supera el nivel mundial

Claude se integra profundamente con Microsoft 365, mejorando aún más la eficiencia empresarial!

El informe revela nuevas tendencias en Internet: más de la mitad del nuevo contenido es generado por IA

El primer modelo de gran escala en el ámbito de la normalización nacional se presenta en línea: resolver los problemas de búsqueda y aplicación de normas