Alibaba Cloud lanza el primer modelo de inteligencia artificial de todo tipo en el mundo, Qwen3-Omni, que permite procesar texto, imágenes, audio y video de forma unificada

AIbase基地

Publicado elNoticias de IA · 5 minutos de lectura · Sep 23, 2025

Alibaba Cloud ha lanzado Qwen3-Omni, lo que marca el nacimiento del primer modelo de inteligencia artificial de modalidad completa nativa a nivel mundial y ahora está disponible como código abierto. Qwen3-Omni es capaz de procesar varios tipos de entrada, como texto, imágenes, audio y video, y puede proporcionar salidas en tiempo real. Ya sea mediante texto o voz natural, responde rápidamente.

El modelo Qwen3-Omni muestra un desempeño avanzado en múltiples campos. Gracias al preentrenamiento centrado en texto en etapas tempranas y la formación multimodal mixta, el modelo posee una sólida capacidad multimodal. Su desempeño en audio y video es especialmente destacado, y también mantiene un alto estándar en efectos de texto e imagen. Según 36 pruebas estándar de audio y video, Qwen3-Omni alcanzó el nivel más reciente en 22 de ellas, y especialmente en áreas como el reconocimiento automático de voz y la comprensión de audio, su desempeño es comparable al de Gemini2.5Pro de la industria.

Qwen3-Omni admite 119 idiomas de texto y 19 idiomas de entrada de voz, además de 10 idiomas de salida de voz, incluidos inglés, chino, francés y alemán, entre otros. Esta función le permite servir mejor a usuarios de todo el mundo. Su arquitectura innovadora se basa en un sistema MoE (Mezcla de Expertos), combinado con el preentrenamiento AuT, lo que le otorga una potente capacidad de representación general. Además, el diseño de múltiples códigos garantiza una interacción de audio y video de baja latencia, apoyando conversaciones naturales fluidas.

Además de Qwen3-Omni, Alibaba Cloud también ha lanzado Qwen3-TTS, un modelo de texto a voz que admite 17 opciones de tono de voz. Este modelo demuestra un excelente rendimiento en múltiples benchmarks de evaluación, superando a varios competidores, especialmente en estabilidad de voz y similitud de tono de voz.

Qwen-Image-Edit-2509 es otra herramienta recientemente lanzada, enfocada en el soporte para múltiples imágenes en edición de imágenes, mejorando significativamente la coherencia y el efecto de la edición. No solo puede procesar una sola imagen, sino que también admite la edición de múltiples imágenes, satisfaciendo así necesidades de edición más complejas.

GitHub:https://github.com/QwenLM/Qwen3-Omni
huggingface:https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe

Resumen clave:
🌟 Qwen3-Omni es el primer modelo de inteligencia artificial de modalidad completa nativa a nivel mundial, que admite el procesamiento unificado de texto, imágenes, audio y video.
🌐 El modelo admite 119 idiomas de texto y 19 idiomas de entrada de voz, capaz de satisfacer las necesidades multilingües de usuarios globales.
🖼️ Qwen-Image-Edit-2509, recientemente lanzado, admite edición de múltiples imágenes, mejorando significativamente la coherencia y el efecto de la edición.

Musk anuncia el lanzamiento de Grokipedia, desafiando a Wikipedia

La empresa xAI de Musk lanza la plataforma de conocimiento Grokipedia con el objetivo de desafiar a Wikipedia. Esta plataforma integrará al asistente de chat Grok AI, utilizando inteligencia artificial para corregir errores automáticamente y garantizar la precisión del contenido. Musk afirma que será superior a Wikipedia en todos los aspectos y se dedicará a crear una biblioteca de conocimiento abierta.

Los ex investigadores de OpenAI y DeepMind obtienen 300 millones de dólares en financiación semilla para lograr la automatización científica

Periodic Labs completa 300 millones de dólares en financiación semilla, con inversiones de grandes empresas tecnológicas como Andreessen Horowitz y NVIDIA. La empresa fue fundada por investigadores anteriores del Google Brain y DeepMind, y su herramienta de IA GNoME descubrió más de 2 millones de nuevos cristales en 2023, demostrando un gran potencial en el desarrollo de materiales.

La capitalización de mercado de NVIDIA supera los 4,5 billones de dólares, y se registran numerosos acuerdos sobre infraestructura de IA

Las acciones de NVIDIA alcanzaron un nuevo máximo el martes, subiendo casi un 3%, con una capitalización de mercado que superó los 4,5 billones de dólares, lo que representa un aumento acumulado del 39% este año. La empresa está acelerando sus inversiones en el sector de la IA. OpenAI anunció que NVIDIA invertirá 100.000 millones de dólares en forma de acciones y planea construir centros de datos de IA de miles de billones de dólares equipados con sus GPUs, lo que ha generado atención en el mercado.

Mejora del motor de búsqueda Brave: la función de preguntas y respuestas de IA ofrece una experiencia de búsqueda más detallada

El navegador Brave presenta una nueva función de búsqueda de IA, que proporciona respuestas más detalladas a las preguntas, complementando la función AI Answers. Este servicio no requiere cambiar de modo y optimiza automáticamente la experiencia de búsqueda para los usuarios. Actualmente, tiene más de 15 millones de usuarios activos al día.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Alibaba Cloud lanza el primer modelo de inteligencia artificial de todo tipo en el mundo, Qwen3-Omni, que permite procesar texto, imágenes, audio y video de forma unificada

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Musk anuncia el lanzamiento de Grokipedia, desafiando a Wikipedia

OpenAI lanza Sora2 y una aplicación de red social del mismo nombre: un TikTok de Sora que admite la generación sincronizada de audio y video

Meta y CoreWeave alcanzan un acuerdo de infraestructura de inteligencia artificial por 14.200 millones de dólares

Meta lanza un nuevo modelo CWM para ayudar en la comprensión y generación de código

Los ex investigadores de OpenAI y DeepMind obtienen 300 millones de dólares en financiación semilla para lograr la automatización científica

Trump firma una orden para invertir 50 millones de dólares en la investigación de inteligencia artificial sobre el cáncer infantil

La capitalización de mercado de NVIDIA supera los 4,5 billones de dólares, y se registran numerosos acuerdos sobre infraestructura de IA

Opera lanza un navegador Neon impulsado por IA para mejorar la productividad y la gestión inteligente de tareas

OpenAI lanza la aplicación de video corto Sora, actualiza el modelo de generación de videos Sora 2

Mejora del motor de búsqueda Brave: la función de preguntas y respuestas de IA ofrece una experiencia de búsqueda más detallada

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

​Alibaba Cloud lanza el primer modelo de inteligencia artificial de todo tipo en el mundo, Qwen3-Omni, que permite procesar texto, imágenes, audio y video de forma unificada

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

​Musk anuncia el lanzamiento de Grokipedia, desafiando a Wikipedia

OpenAI lanza Sora2 y una aplicación de red social del mismo nombre: un TikTok de Sora que admite la generación sincronizada de audio y video

Meta y CoreWeave alcanzan un acuerdo de infraestructura de inteligencia artificial por 14.200 millones de dólares

Meta lanza un nuevo modelo CWM para ayudar en la comprensión y generación de código

​Los ex investigadores de OpenAI y DeepMind obtienen 300 millones de dólares en financiación semilla para lograr la automatización científica

Trump firma una orden para invertir 50 millones de dólares en la investigación de inteligencia artificial sobre el cáncer infantil

La capitalización de mercado de NVIDIA supera los 4,5 billones de dólares, y se registran numerosos acuerdos sobre infraestructura de IA

Opera lanza un navegador Neon impulsado por IA para mejorar la productividad y la gestión inteligente de tareas

OpenAI lanza la aplicación de video corto Sora, actualiza el modelo de generación de videos Sora 2

Mejora del motor de búsqueda Brave: la función de preguntas y respuestas de IA ofrece una experiencia de búsqueda más detallada

GEO Services

Alibaba Cloud lanza el primer modelo de inteligencia artificial de todo tipo en el mundo, Qwen3-Omni, que permite procesar texto, imágenes, audio y video de forma unificada

Musk anuncia el lanzamiento de Grokipedia, desafiando a Wikipedia

Los ex investigadores de OpenAI y DeepMind obtienen 300 millones de dólares en financiación semilla para lograr la automatización científica