¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentaremos los temas más relevantes del campo de la IA, enfocados en desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.
Conozca nuevos productos de IA aquí: https://top.aibase.com/
1. La Administración Nacional de Radio y Televisión de China publica una "sugerencia de gestión" para regular el fenómeno de la IA "modificada", y las películas clásicas sufren parodias
La Administración Nacional de Radio y Televisión de China (NRTC) ha publicado una sugerencia de gestión sobre el fenómeno de los vídeos "modificados" por IA, haciendo hincapié en las medidas de control para proteger la cultura clásica. Recientemente, varias películas y series clásicas han sido objeto de parodias y adaptaciones no autorizadas, lo que ha suscitado la preocupación del público por la cultura tradicional. La administración exige a las autoridades provinciales que insten a las plataformas de vídeos cortos a eliminar este tipo de contenido y que apliquen la revisión de contenido generado por IA para evitar el engaño y las infracciones de derechos de autor.
【Resumen de AiBase:】
🚫 La NRTC publica una sugerencia para regular el fenómeno de los vídeos "modificados" por IA y proteger la cultura clásica.
🎥 Varias películas y series clásicas han sido objeto de parodias, afectando la percepción y los valores culturales tradicionales del público.
🔍 Las plataformas deben revisar estrictamente el contenido generado por IA para evitar el engaño y la violación de derechos de autor.
2. Lanzamiento de la versión internacional de Haier AI con una potente función de clonación de voz por IA
Haier AI ha lanzado recientemente su módulo de clonación de audio en su versión internacional. Los usuarios solo necesitan una muestra de audio de 10 a 60 segundos para replicar perfectamente su voz. Este avance tecnológico ha generado un gran interés en el campo de la clonación de voz en chino, y muchos usuarios se han mostrado sorprendidos por la excelente calidad de la clonación de audio. El sistema no solo es fácil de usar, sino que también admite varios idiomas y opciones de emociones, satisfaciendo ampliamente las necesidades de los usuarios.
【Resumen de AiBase:】
🌟 Con solo 10 a 60 segundos de audio, Haier AI puede replicar perfectamente la voz del usuario, superando las limitaciones de la clonación de voz en chino.
🎤 El sistema admite 12 idiomas y permite a los usuarios seleccionar diferentes emociones para enriquecer la expresión vocal.
💻 Actualmente, la función de audio de Haier AI es gratuita, y los usuarios pueden crear fácilmente varios modelos de voz.
Enlace de detalles: https://www.hailuo.ai/audio
3. Actualización de Runway Act One: Integra tu actuación y voz a la perfección en los personajes de vídeo
La última actualización de Runway Act One ha revolucionado la creación de vídeos, permitiendo a los usuarios aplicar su propia actuación y voz directamente a otros personajes de vídeo, logrando una sincronización perfecta. Este avance tecnológico no solo reduce el umbral de creación, sino que también ofrece una flexibilidad sin precedentes para la creación de películas, permitiendo a los creadores realizar audiciones y transferir actuaciones en cualquier momento y lugar.
【Resumen de AiBase:】
🎭 Transferencia de actuación multidimensional: los movimientos, la voz y las expresiones se pueden integrar perfectamente en cualquier personaje.
📱 Audiciones fáciles: los actores pueden grabar con su teléfono móvil y transferir fácilmente su actuación al personaje objetivo.
🖥️ Combinación de IA: utilizando herramientas como Midjourney, los creadores pueden ampliar los vídeos cortos a actuaciones completas.
Enlace de detalles: https://top.aibase.com/tool/runway
4. OpenAI está a punto de lanzar el nuevo generador de vídeo Sora, que admite varias formas de generación
OpenAI anunció recientemente en la conferencia C21Media de Londres el próximo lanzamiento de una versión actualizada del generador de vídeo Sora. Esta versión admitirá varias formas de generación, incluyendo texto, imágenes y vídeo, mejorando significativamente la experiencia de creación de vídeo de los usuarios. La nueva versión presenta mejoras notables en eficiencia y velocidad, y se espera que se lance oficialmente en la campaña de promoción de invierno de diciembre, junto con otras nuevas funciones como GPT-4.5.
【Resumen de AiBase:】
🌟 La versión actualizada del generador de vídeo Sora admitirá la generación de vídeo a partir de texto, imágenes y vídeo, mejorando la flexibilidad creativa.
🚀 El nuevo generador presenta mejoras significativas en velocidad y eficiencia, mejorando la experiencia del usuario.
📅 Se espera que se lance en la campaña de promoción de invierno de diciembre, y posiblemente se lancen otras funciones nuevas como GPT-4.5.
5. La herramienta de reparación de vídeo de alta definición VISION XL convierte vídeos borrosos en nítidos con un solo clic
Con el avance de la tecnología, VISION XL, como herramienta de reparación y superresolución de vídeo, destaca por su rendimiento excepcional y su facilidad de uso. No solo puede reparar las partes que faltan en el vídeo y eliminar el desenfoque, sino que también puede mejorar significativamente la nitidez del vídeo, alcanzando hasta cuatro veces la superresolución. Su marco de procesamiento basado en modelos de difusión latente reduce la dependencia de módulos de preentrenamiento adicionales, lo que aumenta considerablemente la eficiencia del procesamiento de vídeo de alta resolución.
【Resumen de AiBase:】
✨ VISION XL puede reparar las partes que faltan en el vídeo, eliminar el desenfoque y mejorar la nitidez, alcanzando hasta cuatro veces la superresolución.
⚙️ Emplea un marco de procesamiento basado en modelos de difusión latente, reduciendo la dependencia de módulos de preentrenamiento adicionales y mejorando la eficiencia del procesamiento.
🚀 Solo necesita 13 GB de memoria de vídeo para procesar vídeos de 25 fotogramas, con un tiempo de procesamiento inferior a 2,5 minutos, ideal para aplicaciones rápidas.
Enlace de detalles: https://vision-xl.github.io/
6. La plataforma de redes sociales X de Musk lanza el generador de imágenes Aurora
La red social X de Elon Musk ha lanzado recientemente el nuevo generador de imágenes Aurora, diseñado para crear imágenes con un realismo fotográfico. Aunque algunos usuarios no pudieron acceder a esta función poco después de su lanzamiento, Aurora permite a los usuarios generar imágenes de personajes públicos y con derechos de autor, incluido Mickey Mouse, sin restricciones. La herramienta destaca en la generación de imágenes de bodegones y paisajes, pero también presenta algunas deficiencias, como la fusión poco natural de objetos en la imagen y la ausencia de dedos en los retratos.
【Resumen de AiBase:】
🌟 Se lanza el nuevo generador de imágenes Aurora, que permite a los usuarios generar diversos tipos de imágenes.
🚫 Algunos usuarios no pudieron acceder a la función en las primeras horas posteriores a su lanzamiento.
💰 La plataforma social X pone la función Grok a disposición de todos los usuarios.
7. El nuevo modelo Gemini-Exp-1206 de Google arrasa con la competencia, superando a ChatGPT y convirtiéndose en el nuevo rey de la IA
El nuevo modelo Gemini-Exp-1206 de Google ha generado un gran interés en el campo de la IA generativa. Con una puntuación de 1379 en la clasificación LMArena, ha superado los 1366 puntos de ChatGPT-4.0, demostrando su excepcional capacidad integral. Aunque Gemini-Exp-1206 ha destacado en varias evaluaciones, el número de votos sigue siendo inferior al de ChatGPT-4.0, lo que indica la ventaja de este último en términos de fiabilidad.
【Resumen de AiBase:】
🌟 Gemini-Exp-1206 obtiene 1379 puntos en la clasificación LMArena, superando los 1366 puntos de ChatGPT-4.0.
🗳️ ChatGPT-4.0 recibe 21.929 votos, significativamente más que los 5052 votos de Gemini-Exp-1206, lo que refleja su fiabilidad.
🔍 El modelo experimental Gemini ofrece a los desarrolladores oportunidades sin precedentes para experimentar con la IA, pero aún se encuentra en fase de prueba y no es adecuado para uso en producción.
Enlace de detalles: https://ai.google.dev/gemini-api/docs/models/experimental-models?hl=zh-cn
8. NegToMe redefine la generación de imágenes: reduce el riesgo de infracción de derechos de autor, mejora la diversidad y la calidad visual
NegToMe es una tecnología revolucionaria de generación de imágenes que utiliza un método de orientación adversaria impulsado por imágenes, superando las limitaciones de los avisos negativos tradicionales y mejorando significativamente la diversidad y la calidad de las imágenes generadas. Al reducir la similitud entre el contenido generado y las obras con derechos de autor, resuelve el problema de la protección de los derechos de autor y también destaca en aplicaciones multidominio, ofreciendo a los creadores una mayor libertad creativa.
【Resumen de AiBase:】
🎨 NegToMe, mediante un método de orientación adversaria impulsado por imágenes, mejora significativamente la diversidad de las imágenes generadas, especialmente en el tratamiento de razas y géneros.
🔒 Esta tecnología reduce la similitud entre el contenido generado y las obras con derechos de autor; las pruebas muestran una reducción de la similitud del 34,57 %, lo que resuelve eficazmente el problema de la protección de los derechos de autor.
⚙️ NegToMe es fácil de integrar; los desarrolladores solo necesitan una pequeña cantidad de código para aplicarlo, el tiempo de inferencia apenas se ve afectado y es compatible con varios modelos de difusión.
Enlace de detalles: https://github.com/1jsingh/negtome
9. X pone Grok AI a disposición de todos los usuarios: los usuarios comunes también pueden generar imágenes gratis
xAI ha anunciado recientemente que su chatbot Grok está disponible para usuarios de todo el mundo, ofreciendo una oportunidad de bajo coste para experimentar con la IA. Los usuarios de la versión gratuita tienen algunas limitaciones, como la cantidad diaria de imágenes que pueden crear y la cantidad de mensajes que pueden enviar. Esta medida no solo atrae a más usuarios para que conozcan la tecnología de IA, sino que también refleja la estrategia comercial de xAI para la promoción de sus productos.
【Resumen de AiBase:】
🖼️ Grok permite a los usuarios crear o analizar un máximo de 3 imágenes al día.
💬 Los usuarios solo pueden enviar 10 mensajes en dos horas para controlar la frecuencia de uso.
📈 xAI atrae a los usuarios ofreciendo Grok de forma gratuita, y es probable que en el futuro se lancen más funciones de pago.
10. Google Fotos lanza el resumen fotográfico anual 2024: generación inteligente con IA, que registra tus momentos especiales
Con el desarrollo de la tecnología digital, Google Fotos ha lanzado la función de resumen fotográfico anual 2024, utilizando la tecnología de IA para ofrecer a los usuarios una experiencia personalizada. Gracias a Gemini AI, los usuarios pueden obtener etiquetas de fotos generadas inteligentemente, revisando momentos importantes y datos de captura. Aunque esta función ofrece a los usuarios la oportunidad de compartir buenos recuerdos, también puede evocar algunos recuerdos desagradables.
【Resumen de AiBase:】
🤖 La tecnología de IA genera etiquetas de fotos personalizadas, destacando los momentos importantes del año.
📊 Ofrece estadísticas detalladas de los datos de captura, facilitando a los usuarios el compartir sus estadísticas personales.
😢 Puede evocar algunos recuerdos desagradables, ya que la IA aún no comprende completamente las necesidades emocionales de los usuarios.
11. OpenAI decide colaborar con un contratista militar, ¡los empleados internos se oponen!
La colaboración de OpenAI con Anduril ha provocado una fuerte reacción entre los empleados, muchos de los cuales expresan su preocupación por el uso de la tecnología en el ámbito militar y exigen una mayor transparencia. Aunque la dirección ha destacado que la colaboración se limita a los sistemas de defensa, los empleados dudan de esta limitación.
【Resumen de AiBase:】
🌐 La colaboración de OpenAI con Anduril genera preocupación entre los empleados por el uso militar de la IA.
🛡️ La dirección afirma que la colaboración se limita a los sistemas de defensa, pero los empleados dudan de las restricciones en la aplicación de la tecnología.
📉 El cambio de política muestra que OpenAI comienza a aceptar la aplicación de su tecnología en el ámbito militar.
12. Expertos en IA: una consulta de ChatGPT equivale a desperdiciar medio litro de agua
El rápido desarrollo de la inteligencia artificial generativa ha planteado problemas medioambientales, especialmente en cuanto al consumo de energía y recursos hídricos. La profesora Kate Crawford señaló en una conferencia que, de no tomarse medidas de sostenibilidad, el consumo energético de la inteligencia artificial generativa alcanzará en un año el nivel de Japón.
【Resumen de AiBase:】
🌍 Una consulta de ChatGPT desperdicia medio litro de agua, lo que recuerda a la gente la influencia de la inteligencia artificial en los recursos hídricos.
⚡ El consumo energético de la inteligencia artificial generativa podría alcanzar el nivel de Japón en un año, por lo que es necesario establecer planes de desarrollo sostenible.
🤝 La sostenibilidad debe ser la prioridad del sector de la inteligencia artificial, no la clasificación competitiva.