Noticias de IA: Adobe lanza el modelo de video Firefly IA; Kimi presenta un modo de llamada de voz multifuncional; el modelo CogView3-Plus de Zhipu se convierte en código abierto

¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentaremos los temas más relevantes del campo de la IA, con enfoque en desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Productos de IA nuevos ¡Infórmese aquí!:https://top.aibase.com/

1、Kimi lanza modo de llamada de voz multifuncional con cambio de voz y ajuste de velocidad

El asistente de inteligencia artificial Kimi ha lanzado recientemente su esperada función de llamadas de voz, ofreciendo a los usuarios una experiencia interactiva enriquecida. La nueva función combina diversas aplicaciones y experiencias personalizadas para mejorar la eficiencia de la comunicación y satisfacer las necesidades individuales. Se han profundizado las aplicaciones de la función para escenarios específicos, como la práctica de inglés y las simulaciones de entrevistas, ofreciendo soluciones innovadoras para el aprendizaje y el ámbito profesional. La incorporación de la tecnología de clonación de voz añade un toque divertido, y se sigue prestando atención a los comentarios de los usuarios para optimizar y ampliar el alcance de las aplicaciones del servicio de voz.

【Resumen de AiBase:】
🌟 El asistente Kimi actualiza la función de llamadas de voz, mejorando la experiencia interactiva del usuario.
🎤 Admite subtítulos en tiempo real y voz ajustable, para una interacción más natural.
🤖 Incorpora tecnología de clonación de voz, aumentando la diversión y los escenarios de aplicación.

2、El modelo CogView3-Plus de Zhipu se convierte en código abierto: una nueva era para la tecnología de generación de imágenes a partir de texto

El equipo de tecnología Zhipu ha lanzado CogView3 y su versión mejorada CogView3-Plus-3B, marcando una nueva etapa en la creación artística asistida por IA. CogView3 ofrece un rendimiento asombroso, superando a SDXL en un 77% y con una velocidad de inferencia diez veces menor que la de SDXL. CogView3-Plus incorpora el framework DiT y un mecanismo de atención conjunta texto-imagen, mejorando el rendimiento y reduciendo los costes. El repositorio de código abierto ya está disponible, impulsando el rápido desarrollo del campo de la generación de imágenes de IA, con un amplio futuro para las aplicaciones de tecnología de generación de imágenes a partir de texto.

【Resumen de AiBase:】
🚀 CogView3 y CogView3-Plus-3B se convierten en código abierto, marcando una nueva etapa en la creación artística asistida por IA.
💡 CogView3 ofrece un rendimiento asombroso, superando a SDXL en un 77% y con una velocidad de inferencia diez veces menor.
💻 CogView3-Plus incorpora el framework DiT y un mecanismo de atención conjunta texto-imagen, mejorando el rendimiento y reduciendo los costes.
Enlace de detalles:https://top.aibase.com/tool/cogview3Plus

3、Adobe lanza el modelo de vídeo Firefly AI; Photoshop añade varias funciones de IA

Adobe presentó en su última conferencia MAX el modelo de vídeo Firefly AI y varias herramientas mejoradas de Photoshop, ofreciendo a los usuarios nuevas y emocionantes funciones de IA. El modelo de vídeo Firefly permite a los usuarios crear o modificar contenido de vídeo mediante indicaciones de texto, ofreciendo a los creadores un nuevo espacio creativo. Al mismo tiempo, las nuevas herramientas de IA de Photoshop, como la herramienta de eliminación y la función de relleno generativo, facilitan la edición de imágenes. Adobe se compromete a utilizar únicamente contenido con licencia para entrenar sus modelos y lanza credenciales de contenido para aumentar la transparencia.

【Resumen de AiBase:】
📹 El modelo de vídeo Firefly AI permite a los usuarios crear y modificar contenido de vídeo mediante texto, ofreciendo a los creadores un nuevo espacio creativo.
🖼️ Photoshop añade varias herramientas de IA, como la herramienta de eliminación y el relleno generativo, facilitando la edición de imágenes.
🔍 Adobe se compromete a utilizar únicamente contenido con licencia para entrenar sus modelos y lanza credenciales de contenido para aumentar la transparencia.
Enlace de detalles:https://blog.adobe.com/en/publish/2024/09/11/bringing-gen-ai-to-video-adobe-firefly-video-model-coming-soon

4、ChatGPT se transforma: nueva interfaz con función de búsqueda

OpenAI ha realizado recientemente una importante actualización de ChatGPT, transformándolo de un simple asistente de conversación a una plataforma de información integral. La actualización de la interfaz incluye la nueva función Canvas y el cambio de posición del cuadro de indicaciones, para una experiencia de usuario más cómoda. La función SearchGPT permite a los usuarios acceder a datos en tiempo real de la web, y se colabora con importantes editoriales para garantizar la fiabilidad de la información.

【Resumen de AiBase:】
🔍 Nuevo diseño de interfaz: se añade la función Canvas y se cambia la posición del cuadro de indicaciones, mejorando la experiencia del usuario.
🌐 Se incorpora la función SearchGPT: se activa pulsando /, permitiendo acceder a datos en tiempo real de la web, con referencias y enlaces en línea.
💡 Fácil de usar: funcionamiento intuitivo, proporciona respuestas con fuentes en segundos tras la pregunta, permitiendo realizar preguntas de seguimiento para profundizar en el tema.

5、Volcano Engine lanza una solución de preprocesamiento de vídeo para el entrenamiento de grandes modelos

Volcano Engine presentó en su reciente conferencia de tecnología de nube de vídeo una solución de preprocesamiento de vídeo para el entrenamiento de grandes modelos. Esta tecnología ya se ha aplicado con éxito al modelo de generación de vídeo Doubao, marcando un importante avance en la tecnología de generación de vídeo con IA.

【Resumen de AiBase:】
🔑 Las tecnologías AIGC y multimodales están cambiando profundamente la experiencia del usuario.
🔑 Volcano Engine explora la integración de grandes modelos de IA y tecnología de vídeo, ofreciendo soluciones integrales.
🔑 La solución de preprocesamiento desarrollada por Volcano Engine optimiza los algoritmos y la ingeniería, mejorando la eficiencia del entrenamiento del modelo.

6、Midjourney lanzará próximamente un editor en línea; versión V7 y funciones personalizadas en camino

Midjourney ha anunciado recientemente una serie de emocionantes actualizaciones y nuevas funciones que se lanzarán próximamente, mostrando el rápido desarrollo e innovación de la empresa en el campo de la generación de imágenes con IA. El equipo está trabajando activamente en varios proyectos, centrándose en mejorar la calidad y desarrollar funciones centrales, en lugar de apresurarse a lanzar nuevos productos.

【Resumen de AiBase:】
🚀 Midjourney lanzará próximamente un nuevo editor en línea que permitirá a los usuarios importar imágenes y utilizar funciones de mapas de profundidad y reparación de imágenes para editarlas.
💡 El equipo está optimizando la interfaz de usuario para diferenciar las nuevas funciones de las funciones de imagen existentes, y está debatiendo qué funciones incluir en el lanzamiento inicial.
🔧 Midjourney está desarrollando nuevas herramientas para facilitar a los usuarios la gestión y el cambio entre varias configuraciones personalizadas, introduciendo un sistema de personalización de estilo más refinado.

7、Microsoft está creando un compañero de IA que puede "ver" y "recordar" todo el comportamiento del usuario

Recientemente, Microsoft está trabajando en el desarrollo de un compañero de IA que observa en tiempo real el comportamiento del usuario, con el objetivo de establecer una relación interactiva profunda. Esto refleja la necesidad humana fundamental de desahogo, comprensión y compañía. Al mismo tiempo, la nueva función Recall de Windows permite profundizar en el historial digital del usuario, recreando experiencias pasadas. Zoom lanza una función de clonación de IA que permite a los usuarios enviar una versión digital de sí mismos a las reuniones, mejorando la eficiencia del trabajo.

【Resumen de AiBase:】
🌟 Microsoft está desarrollando un compañero de IA que observa en tiempo real el comportamiento del usuario, con el objetivo de establecer una relación interactiva profunda.
📂 La nueva función Recall de Windows permite profundizar en el historial digital del usuario, recreando experiencias pasadas.
💬 Zoom lanza una función de clonación de IA que permite a los usuarios enviar una versión digital de sí mismos a las reuniones, mejorando la eficiencia del trabajo.

8、El vicepresidente de IA de Microsoft se une a OpenAI para dedicarse a la investigación de AGI

Sebastián Bubeck, vicepresidente de IA de Microsoft, ha dejado Microsoft para unirse a OpenAI, donde se dedicará a la investigación de la inteligencia artificial general (AGI). Este cambio marca un punto de inflexión en la carrera de Bubeck y supone un gran apoyo para el desarrollo de OpenAI.

【Resumen de AiBase:】
🧠 Bubeck deja Microsoft y se une a OpenAI para centrarse en la investigación de AGI.
🤝 La relación entre Microsoft y OpenAI es compleja, ya que es inversor y competidor a la vez, y ambas partes esperan seguir colaborando.
🚀 La incorporación de Bubeck impulsará los avances de OpenAI en modelos de lenguaje pequeños y en la investigación de AGI.

9、¡Impresionante! El modelo de IA DIAMOND puede simular Counter-Strike, ejecutándose en una sola RTX3090

Los investigadores han desarrollado el modelo de IA DIAMOND, capaz de simular el juego Counter-Strike: Global Offensive, ejecutándose en una tarjeta gráfica Nvidia RTX3090 a una velocidad de 10 fotogramas por segundo. Aunque presenta algunos defectos, se espera que en el futuro se mejore el rendimiento del modelo aumentando los datos y la capacidad de cálculo.

【Resumen de AiBase:】
🎮 El modelo DIAMOND puede simular el juego CS:GO a una velocidad de 10 fotogramas por segundo.
📊 Entrenado con solo 87 horas de datos de juego, aún puede simular escenas de juego complejas.
🐛 Presenta defectos, como saltos infinitos y desviaciones de trayectoria que provocan fallos en la simulación, pero tiene potencial de mejora en el futuro.
Enlace de detalles:https://diamond-wm.github.io/

10、La demanda de GPU Blackwell de Nvidia se dispara; la oferta de los próximos 12 meses está completamente vendida

La última generación de GPU Blackwell de Nvidia ha generado una demanda sin precedentes. El CEO Jensen Huang ha revelado que la oferta de los próximos 12 meses ya está agotada, lo que demuestra una vez más el deseo del mercado por la computación de alto rendimiento.

【Resumen de AiBase:】
💡 La demanda de GPU Blackwell se dispara, con la oferta de los próximos 12 meses completamente vendida.
🔍 Los principales clientes incluyen a grandes empresas tecnológicas como AWS y Google, impulsando el crecimiento del mercado.
📈 NVIDIA prevé enviar miles de millones de dólares en GPU Blackwell en 2024, con un crecimiento significativo de los ingresos del centro de datos.

11、El precio de las acciones de Nvidia alcanza un nuevo máximo histórico; la capitalización bursátil se acerca a los 3,4 billones de dólares

El precio de las acciones de Nvidia alcanzó un nuevo máximo histórico esta semana, con una capitalización bursátil cercana a los 3,4 billones de dólares, lo que ha entusiasmado a los inversores. La fortuna personal del CEO Jensen Huang supera los 121.500 millones de dólares, impulsada por la gran demanda del nuevo chip Blackwell. Nvidia consolida su liderazgo en el mercado de chips de IA, con una capitalización bursátil solo superada por Apple, demostrando su gran fortaleza.

【Resumen de AiBase:】
🚀 El precio de las acciones de Nvidia alcanza un nuevo máximo histórico de 138,07 dólares, con un aumento de casi el 180% en el año.
📊 La empresa tiene una cuota de mercado del 70% al 95% en el mercado de chips de IA, con una capitalización bursátil de 3,4 billones de dólares.
💡 El CEO Jensen Huang afirma que la demanda del nuevo chip Blackwell es "frenética" y que ya está agotada hasta el próximo año.

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

Noticias de IA: Adobe lanza el modelo de video Firefly IA; Kimi presenta un modo de llamada de voz multifuncional; el modelo CogView3-Plus de Zhipu se convierte en código abierto

站长之家

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Qwen VLo, el modelo de comprensión y generación multimodal unificado de Tongyi Qianwen

¡Noticia importante! El primer gran modelo de código abierto en el mar de China, Cangyuan, ha aparecido, impulsando la era de la inteligencia oceánica

Suno adquiere WavTool para fortalecer sus herramientas de edición de música con IA en medio de controversias sobre derechos de autor musicales

Diario de IA del 27 de junio: Tencent libera como código abierto el modelo Huyuan-A13B ligero; Keling AI lanzará una función de efectos de sonido para videos

Se revela la lista de unicornios globales! SpaceX, ByteDance y OpenAI se llevan los primeros puestos

Tencent libera un modelo ligero de HuanYuan-A13B, se puede implementar con una sola tarjeta GPU de gama media-baja

Ling AI introduce una función de efectos de sonido para video, ofreciendo una experiencia inmersiva de ver y escuchar

¡Sorpresa total! Anthropic destruyó millones de libros para entrenar a la IA, ¡la disputa por derechos de autor se agrava!

OpenAI anuncia que el evento para desarrolladores de 2025 se celebrará en San Francisco y se espera que atraiga a más de 1500 desarrolladores

Google lanza una aplicación experimental de IA para probar ropa virtual: Doppl, una nueva experiencia de moda