Boletín diario de IA: Los artículos públicos de WeChat admiten imágenes con IA; el nuevo modelo de edición de imágenes ACE de Alibaba Cloud Tongyi Wanxiang; Kuaishou KeLing AI lanza la función de "prueba de ropa con IA"

站长之家

Publicado elNoticias de IA · 21 minutos de lectura · Dec 2, 2024

¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentaremos los temas más relevantes del ámbito de la IA, enfocados en desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Nuevos productos de IA ¡Descubra más!

1. 微信公众号 ahora permite la creación de imágenes con IA: ¡incluso se puede ajustar el estilo y las proporciones!

微信公众号 (WeChat) ha lanzado recientemente la nueva función "Creación de imágenes con IA", diseñada para ayudar a los creadores de contenido a seleccionar e insertar imágenes de forma más eficiente. Los usuarios pueden generar imágenes que coincidan con el contenido de su artículo a través de una breve descripción de texto, y ajustar su estilo y proporciones. Esta innovación no solo mejora la eficiencia de la creación, sino que también reduce las preocupaciones sobre los derechos de autor. Actualmente, la función se encuentra en fase de prueba.

¡La función de creación de imágenes con IA se añade al panel de administración de WeChat: ¡Generación de imágenes para artículos en cuestión de segundos!

【Resumen de AiBase:】
🖌️ La función de creación de imágenes con IA permite a los usuarios generar imágenes coincidentes mediante una breve descripción, mejorando la eficiencia de la creación.
📏 Los usuarios pueden ajustar el estilo y las proporciones de las imágenes generadas para asegurar un resultado satisfactorio.
🔒 Esta función se extiende a la portada del artículo, reduciendo las preocupaciones relacionadas con los derechos de autor.

2. Alibaba Cloud Tongyi Wanxiang lanza el nuevo modelo de edición de imágenes ACE, que permite modificar imágenes con un solo clic.

El equipo de Alibaba Cloud Tongyi Wanxiang ha lanzado el nuevo modelo de edición de imágenes ACE, cuyo objetivo es ofrecer un servicio de generación y edición de imágenes sencillo mediante instrucciones sencillas en lenguaje natural. ACE admite múltiples escenarios de aplicación y cuenta con potentes funciones de edición de imágenes, lo que permite a los usuarios realizar fácilmente operaciones como modificar el fondo de una foto de carnet. Su innovación principal reside en el módulo Long-context Condition Unit (LCU), que garantiza la alta calidad de los resultados de edición.

【Resumen de AiBase:】
✨ El modelo ACE permite la generación y edición de imágenes mediante instrucciones en lenguaje natural, simplificando el complejo proceso de edición.
🎨 Admite múltiples escenarios de aplicación, como retoque fotográfico, creación de storyboards y diseño de interiores, satisfaciendo las diversas necesidades de los usuarios.
🔧 El módulo LCU garantiza resultados de edición precisos y ofrece soporte de código abierto a desarrolladores de todo el mundo, impulsando el desarrollo de la tecnología de procesamiento de imágenes inteligente.
Enlace de detalles: https://github.com/ali-vilab/ACE

3. Keling AI anuncia el lanzamiento de la función "Prueba de ropa con IA": el modelo 1.5 añade compatibilidad con los "fotogramas inicial y final".

La función "Prueba de ropa con IA", recién lanzada por Keling AI, permite a los usuarios generar fácilmente imágenes de modelos probándose ropa subiendo al menos dos imágenes. Además, la mejora del modelo 1.5 en el campo de la generación de vídeo a partir de imágenes admite la tecnología de fotogramas inicial y final, lo que permite a los creadores controlar el vídeo con mayor precisión. Keling AI también ha lanzado "Academia de Inspiración", que ofrece cursos gratuitos.

【Resumen de AiBase:】
👚 La función de prueba de ropa con IA permite a los usuarios generar imágenes de prueba de ropa subiendo imágenes de ropa y modelos, y admite el cambio de diferentes prendas.
🎥 La nueva tecnología de fotogramas inicial y final permite a los usuarios subir dos imágenes para controlar con precisión el principio y el final del vídeo, logrando una transición dinámica.
📚 La Academia de Inspiración lanzada por Keling AI ofrece cursos gratuitos para ayudar a los principiantes a dominar rápidamente el uso de las herramientas de IA y promover la difusión de la tecnología.

4. ¿Los influencers virtuales son demasiado rígidos? El Instituto de Tecnología de China y Tencent crean "AnchorCrafter", el "rey de las ventas" de IA, con movimientos y expresiones naturales.

Con el avance de la tecnología, el rendimiento de los influencers virtuales también está mejorando constantemente. AnchorCrafter, desarrollado en colaboración por la Academia China de Ciencias y Tencent, marca el comienzo de una nueva era para los influencers virtuales en el comercio electrónico. Esta herramienta puede generar vídeos de comercio electrónico fluidos y naturales, con movimientos y expresiones muy realistas que mejoran enormemente la experiencia del usuario. Gracias a la tecnología de IA, los usuarios solo necesitan proporcionar una foto del influencer y la información del producto para generar rápidamente vídeos de alta calidad.

【Resumen de AiBase:】
🛍️ AnchorCrafter puede generar vídeos de comercio electrónico fluidos y naturales, mejorando la experiencia del espectador.
🤳 Los usuarios solo necesitan proporcionar una foto del influencer y la información del producto para crear rápidamente un vídeo.
📈 Los resultados experimentales muestran que la calidad del vídeo generado y la naturalidad de los movimientos han alcanzado un nivel líder en la industria.
Enlace de detalles: https://cangcz.github.io/Anchor-Crafter/

5. Adobe lanza MultiFoley, un sistema de generación de efectos de sonido con IA.

Recientemente, el sistema de inteligencia artificial MultiFoley, desarrollado en colaboración entre Adobe y la Universidad de Michigan, representa un gran avance en la tecnología de generación de efectos de sonido. Este sistema puede generar efectos de sonido de alta calidad a partir de indicaciones de texto, ejemplos de audio o vídeo de referencia. La calidad de audio de salida alcanza los 48 kHz, y la precisión de sincronización con el vídeo es de hasta 0,8 segundos, superando significativamente a los sistemas tradicionales.

【Resumen de AiBase:】
🔊 El sistema MultiFoley genera efectos de sonido a partir de entradas de texto, audio y vídeo, con una calidad de sonido de 48 kHz.
🎵 La precisión de sincronización media es de 0,8 segundos, superando significativamente el rendimiento de los sistemas tradicionales de efectos de sonido.
📊 Los estudios de usuarios muestran que el 85,8% de los participantes considera que su coherencia semántica es superior a la de otros sistemas.

6. MyTimeMachine: sube 50 fotos y estima cómo te verás a diferentes edades.

MyTimeMachine es una tecnología innovadora que puede transformar la edad facial de forma personalizada mediante 50 fotos de autorretratos subidas por el usuario. Este sistema combina modelos globales de envejecimiento para generar efectos de cambio de edad de alta fidelidad, manteniendo al mismo tiempo las características de identidad del usuario. Esta tecnología no solo es aplicable a imágenes estáticas, sino que también se puede ampliar al procesamiento de vídeo, con amplias aplicaciones en efectos especiales cinematográficos y publicidad.

【Resumen de AiBase:】
🌟 MyTimeMachine combina modelos globales de envejecimiento y autorretratos personales del usuario para lograr una transformación de edad personalizada.
📸 Solo se necesitan 50 fotos personales para entrenar la red adaptadora y generar efectos de cambio de edad realistas.
🎥 Esta tecnología no solo es aplicable a imágenes estáticas, sino que también se puede ampliar a vídeos, logrando efectos de envejecimiento de alta calidad que conservan la identidad.
Enlace de detalles: https://mytimemachine.github.io/

7. ¡Operación inversa! TryOffDiff puede extraer ropa de un modelo con un solo clic y convertirla en una imagen de prenda estandarizada.

TryOffDiff es una tecnología de IA desarrollada por la Universidad de Bielefeld, Alemania, cuyo objetivo es resolver la gran diferencia entre las fotos de los compradores y las fotos de los vendedores en las compras online. Mediante un potente modelo de difusión, TryOffDiff puede extraer las características de la ropa de una foto y generar una imagen de alta definición para la presentación estándar del producto, eliminando el fondo y obteniendo resultados comparables a los de un fotógrafo profesional.

【Resumen de AiBase:】
🧵 TryOffDiff utiliza tecnología de IA para extraer las características de la ropa y generar imágenes de alta definición para la presentación de productos.
📸 Las imágenes generadas tienen detalles nítidos y el fondo se elimina automáticamente, con resultados comparables a los de la fotografía profesional.
🛒 Esta tecnología ayuda a mejorar la presentación de productos en las plataformas de comercio electrónico y reduce la tasa de devoluciones.
Enlace de detalles: https://huggingface.co/spaces/rizavelioglu/tryoffdiff

8. Incluso una antigua tarjeta gráfica GTX580 puede entrenar GPT-4, aunque el coste es diez veces superior.

Epoch AI ha lanzado recientemente un simulador interactivo que revela la posibilidad de entrenar GPT-4 utilizando la antigua tarjeta gráfica GTX580, aunque el coste es diez veces superior al del hardware moderno. Los estudios muestran que el número de operaciones de punto flotante necesarias para entrenar GPT-4 está entre 1e25 y 1e26, y la eficiencia suele disminuir a medida que aumenta el tamaño del modelo.

【Resumen de AiBase:】
💰 El coste de entrenar GPT-4 con una tarjeta gráfica GTX580 es diez veces superior al del hardware moderno, y la eficiencia es menor.
📊 El simulador puede analizar las diferencias de rendimiento entre diferentes GPU y admite simulaciones de entrenamiento complejas en múltiples centros de datos.
🔍 Este estudio tiene como objetivo comprender a fondo las necesidades de hardware futuras para apoyar el entrenamiento de grandes modelos de IA.

9. Un usuario de criptomonedas convence al robot IA Freysa para que transfiera un premio de 47.000 dólares.

En un singular juego de confrontación entre humanos e inteligencia artificial, un usuario de criptomonedas logró convencer al robot IA autónomo Freysa para que le transfiriera un premio de más de 47.000 dólares. A pesar de que los 481 intentos anteriores fracasaron, este escritor tecnológico, mediante ingeniosas indicaciones y una profunda comprensión de las funciones de Freysa, logró finalmente superar las defensas de la IA y obtuvo la victoria.

【Resumen de AiBase:】
💰 Un usuario de criptomonedas convenció con éxito al robot IA Freysa para que transfiriera los fondos del premio mediante indicaciones ingeniosas.
🤝 El jugador estuvo dispuesto a donar 100 dólares y finalmente obtuvo la aprobación de Freysa, realizando con éxito la transferencia.
🧠 El mecanismo de decisión de Freysa sigue siendo un misterio, mostrando la creatividad e inteligencia humana en la interacción con la IA.

10. Musk solicita una orden judicial para impedir que OpenAI se convierta en una empresa con fines de lucro.

Recientemente, el equipo legal del director ejecutivo de Tesla, Elon Musk, solicitó al tribunal una orden judicial provisional para impedir que OpenAI se convierta en una empresa con fines de lucro, alegando que si Musk gana el juicio, OpenAI podría carecer de fondos para pagar las indemnizaciones. Además, Musk acusa a OpenAI y a su inversor Microsoft de violar las leyes antimonopolio y exige a los inversores que no apoyen a la competencia.

【Resumen de AiBase:】
⚖️ El equipo legal de Musk solicita al tribunal que impida que OpenAI se convierta en una empresa con fines de lucro, ya que considera que podría enfrentarse a riesgos de indemnización.
📉 Acusa a OpenAI y Microsoft de violar las leyes antimonopolio de Estados Unidos y exige a los inversores que no apoyen a la competencia.
💰 Musk había apoyado el modelo de negocio con fines de lucro de OpenAI, pero ahora se opone a su transformación, lo que refleja la complejidad de la competencia en el sector.

11. OpenAI espera alcanzar los 1000 millones de usuarios a finales de año gracias a su colaboración con Apple.

OpenAI está haciendo todo lo posible para alcanzar su objetivo de 1000 millones de usuarios para 2025, y planea lograr este crecimiento mediante el lanzamiento de nuevos productos, la construcción de centros de datos y la colaboración con Apple. Desde el lanzamiento de ChatGPT, el número de usuarios ha aumentado hasta alcanzar los 250 millones de usuarios activos semanales. La empresa ha recaudado 6000 millones de dólares en Silicon Valley y planea seguir ampliando su financiación para apoyar su desarrollo.

【Resumen de AiBase:】
✨ OpenAI tiene como objetivo alcanzar los 1000 millones de usuarios para 2025 y está utilizando su colaboración con Apple para acelerar el crecimiento.
💰 La empresa ha completado la mayor ronda de financiación de la historia de Silicon Valley, recaudando 6000 millones de dólares, y planea seguir ampliando su financiación.
📈 El uso de la inteligencia artificial generativa en la producción y la gestión de la seguridad está creciendo rápidamente, y cada vez más empresas están empezando a apreciar su valor potencial.

20.000 dólares por un doble de tareas domésticas? El robot humanoide 1X Neo financiado por OpenAI inicia la venta anticipada y entrará en las casas estadounidenses el próximo año

La empresa noruega de robots 1X presenta su primer robot humanoide para uso doméstico, Neo, con un precio de 20.000 dólares y una tarifa de suscripción mensual de 499 dólares. Este robot de 1,68 metros está diseñado especialmente para tareas como lavar platos y ordenar, y utiliza un modelo de cooperación entre IA y operadores humanos a distancia, necesitando soporte externo para completar tareas complejas.

Amazon Cloud planea invertir otros 5.000 millones de dólares en Corea para impulsar la construcción de centros de datos de inteligencia artificial

Amazon AWS anunció que invertirá otros 5.000 millones de dólares en Corea durante los próximos seis años para ampliar los centros de datos de inteligencia artificial, y colaborará con el Grupo SK para construir una instalación grande en Ulsan. La inversión total en Corea alcanzará los 12.600 millones de dólares, lo que demuestra su importancia estratégica para el mercado coreano.

El padre de DayZ compara su temor actual a la inteligencia artificial con el pánico anterior hacia Google y Wikipedia

La rápida evolución de las tecnologías de IA está transformando la industria de los videojuegos. La IA generativa trae nuevas oportunidades y desafíos, y empresas como Microsoft y Amazon están reorientando sus recursos hacia aplicaciones de IA. Los desarrolladores de videojuegos tienen opiniones diferentes sobre esto, y el futuro de la industria sigue siendo incierto.

Qualcomm entra en el centro de datos: lanza las tarjetas AI200/AI250 para competir contra NVIDIA, la acción sube un 20% en un día

Qualcomm presenta dos chips de inferencia de IA en la nube, el AI200 y el AI250, que planea comercializar en 2026 y 2027, lo que marca su transición hacia una infraestructura integral de IA. Esta noticia impulso un aumento del 20% en el precio de las acciones en un solo día, el mayor aumento desde 2019. A diferencia de la estrategia completa de NVIDIA, Qualcomm se centra en el mercado de la inferencia de modelos grandes, destacando su ventaja en eficiencia energética y costo.

Magic Leap anuncia una nueva colaboración con Google para desarrollar el prototipo de las próximas gafas AR

El 29 de octubre, Magic Leap y Google anunciaron una nueva colaboración en la conferencia Iniciativa de Inversión Futura de Riad, trabajando juntos para desarrollar un prototipo de gafas AR y promover avances en la tecnología de realidad aumentada. Ross Rosenburg, líder de Magic Leap, declaró que la empresa se está transformando de pionera en realidad aumentada a socio de ecosistema, aprovechando su experiencia en innovaciones ópticas y de visualización para alcanzar una nueva etapa de su visión.

Tsinghua y Kuaishou lanzan un nuevo modelo de difusión SVG, la eficiencia de entrenamiento aumenta un 6200%

El equipo de Tsinghua y Kuaishou Ling presenta el modelo SVG, que reemplaza al VAE, resolviendo el problema de entrelazamiento semántico, mejorando la eficiencia de entrenamiento en un 6200% y la velocidad de generación en un 3500%, lo que marca el paulatino abandono del VAE en el campo de generación de imágenes.

NVIDIA presenta un diseño revolucionario para centros de datos de IA que impulsa el cálculo de alto rendimiento

En la conferencia GTC de 2025, NVIDIA presentó el "Diseño Omniverse DSX", un esquema diseñado específicamente para centros de datos de IA de nivel giga, conocido como "fábrica de IA". Este esquema está basado en el marco Omniverse y admite diferentes escalas, desde 100 millones hasta 1.000 millones de vatios, con el objetivo de entrenar y ejecutar eficientemente modelos de IA grandes, satisfaciendo la creciente demanda de cálculo de IA, siendo un avance importante en la infraestructura de inteligencia artificial.

Vicepresidente de Douyin, Li Liang: La tecnología de IA ayuda a luchar contra la difusión de rumores y construir un entorno confiable para la plataforma

La televisión central informó sobre el problema de las noticias falsas creadas por la IA. Li Liang, vicepresidente de Douyin, respondió diciendo que la IA es una espada de doble filo: aunque es fácil propagar rumores, Douyin está utilizando la IA para combatirlos, desarrollando agentes inteligentes para buscar rápidamente información autoritativa y desmentir los rumores.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Boletín diario de IA: Los artículos públicos de WeChat admiten imágenes con IA; el nuevo modelo de edición de imágenes ACE de Alibaba Cloud Tongyi Wanxiang; Kuaishou KeLing AI lanza la función de "prueba de ropa con IA"

站长之家

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

20.000 dólares por un doble de tareas domésticas? El robot humanoide 1X Neo financiado por OpenAI inicia la venta anticipada y entrará en las casas estadounidenses el próximo año

Black Forest lanza el primer podcast de IA interactivo en China, los usuarios pueden hacer preguntas en cualquier momento

Amazon Cloud planea invertir otros 5.000 millones de dólares en Corea para impulsar la construcción de centros de datos de inteligencia artificial

El padre de DayZ compara su temor actual a la inteligencia artificial con el pánico anterior hacia Google y Wikipedia

Diario de IA: Douyin presenta un sistema automático de voz múltiple; Adobe Firefly Image 5 se actualiza significativamente; se lanza el modelo de voz SoulX-Podcast de Soul

Qualcomm entra en el centro de datos: lanza las tarjetas AI200/AI250 para competir contra NVIDIA, la acción sube un 20% en un día

Magic Leap anuncia una nueva colaboración con Google para desarrollar el prototipo de las próximas gafas AR

Tsinghua y Kuaishou lanzan un nuevo modelo de difusión SVG, la eficiencia de entrenamiento aumenta un 6200%

​NVIDIA presenta un diseño revolucionario para centros de datos de IA que impulsa el cálculo de alto rendimiento

Vicepresidente de Douyin, Li Liang: La tecnología de IA ayuda a luchar contra la difusión de rumores y construir un entorno confiable para la plataforma

Noticias de IA relacionadas recomendadas

20.000 dólares por un doble de tareas domésticas? El robot humanoide 1X Neo financiado por OpenAI inicia la venta anticipada y entrará en las casas estadounidenses el próximo año

Black Forest lanza el primer podcast de IA interactivo en China, los usuarios pueden hacer preguntas en cualquier momento

Amazon Cloud planea invertir otros 5.000 millones de dólares en Corea para impulsar la construcción de centros de datos de inteligencia artificial

El padre de DayZ compara su temor actual a la inteligencia artificial con el pánico anterior hacia Google y Wikipedia

Diario de IA: Douyin presenta un sistema automático de voz múltiple; Adobe Firefly Image 5 se actualiza significativamente; se lanza el modelo de voz SoulX-Podcast de Soul

Qualcomm entra en el centro de datos: lanza las tarjetas AI200/AI250 para competir contra NVIDIA, la acción sube un 20% en un día

Magic Leap anuncia una nueva colaboración con Google para desarrollar el prototipo de las próximas gafas AR

Tsinghua y Kuaishou lanzan un nuevo modelo de difusión SVG, la eficiencia de entrenamiento aumenta un 6200%

​NVIDIA presenta un diseño revolucionario para centros de datos de IA que impulsa el cálculo de alto rendimiento

Vicepresidente de Douyin, Li Liang: La tecnología de IA ayuda a luchar contra la difusión de rumores y construir un entorno confiable para la plataforma

GEO Services

NVIDIA presenta un diseño revolucionario para centros de datos de IA que impulsa el cálculo de alto rendimiento

NVIDIA presenta un diseño revolucionario para centros de datos de IA que impulsa el cálculo de alto rendimiento