Alibaba lança seu primeiro modelo multimodal completo, Qwen2.5-Omni, desafiando gigantes da tecnologia global

AIbase基地

Publicado emNotícias e Informações de IA · 4 minutos de leitura · Mar 27, 2025

Em 27 de março, às primeiras horas da manhã, a Alibaba lançou seu primeiro grande modelo multimodal completo: o Tongyi Qianwen Qwen2.5-Omni-7B. Este modelo possui recursos poderosos, capaz de processar simultaneamente vários tipos de entrada, incluindo texto, imagens, áudio e vídeo, e gerar texto e saída de voz natural em tempo real. Este avanço tecnológico inovador marca mais um progresso da Alibaba na área da inteligência artificial.

Em avaliações do OmniBench, um benchmark de fusão multimodal de autoridade, o Qwen2.5-Omni alcançou resultados notáveis, quebrando recordes do setor e superando modelos similares, como o Gemini-1.5-Pro do Google. Este resultado não apenas demonstra a poderosa capacidade do Qwen2.5-Omni, mas também consolida ainda mais a posição de liderança da Alibaba na competição tecnológica global.

Cérebro Modelo de Grande Escala

Nota da fonte: A imagem foi gerada por IA, com autorização do provedor de serviços Midjourney.

A singularidade do Qwen2.5-Omni reside em sua capacidade de simular os sentidos humanos, permitindo uma compreensão e cognição do mundo de forma "tridimensional", semelhante à humana. Isso significa que o Qwen2.5-Omni não apenas identifica várias entradas, mas também pode analisar o estado emocional através de áudio e vídeo, fornecendo feedback e capacidade de tomada de decisão mais inteligentes e naturais em tarefas complexas. Isso o torna mais flexível e adaptável em aplicações práticas.

Com o avanço contínuo da tecnologia de IA, o lançamento do Qwen2.5-Omni impulsionará, sem dúvida, o desenvolvimento do setor e fornecerá uma nova força motriz para a transformação digital em vários setores. Ao disponibilizar este grande modelo como código aberto, a Alibaba atraiu a atenção de desenvolvedores globais, criando condições para o desenvolvimento de mais aplicativos inovadores. No futuro, espera-se que o Qwen2.5-Omni tenha um impacto profundo em vários campos, como educação, saúde e entretenimento.

O lançamento da Alibaba representa não apenas um grande avanço tecnológico, mas também uma nova exploração de aplicações futuras de IA multimodal.

Tongyi Qianwen Qwen2.5-Omni-7B Modelo multimodal completo Alibaba OmniBench

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

Google lança novo modelo de geração de vídeo Veo 3 em todo o mundo

O Google anunciou oficialmente a lançamento mundial do seu novo modelo de geração de vídeo Veo3. Essa notícia é aguardada há muito tempo pelos usuários, e o Veo3 já está disponível para usuários Gemini em mais de 159 países, oferecendo uma nova experiência de criação de vídeos. As características do modelo de geração de vídeo Veo3 incluem a capacidade de gerar vídeos com até oito segundos a partir de simples dicas de texto. Segundo a Google, essa tecnologia foi projetada especialmente para usuários criativos, especialmente para os usuários das redes sociais que têm crescente demanda por conteúdo curto.

Jul 4, 2025

DeepMind lança Crome: melhorando a alinhamento de grandes modelos de linguagem com o feedback humano

Na área de inteligência artificial, os modelos de recompensa são componentes fundamentais para alinhar grandes modelos de linguagem (LLMs) ao feedback humano, mas os modelos atuais enfrentam o problema das "hacks de recompensa". Esses modelos normalmente se concentram em características superficiais, como o comprimento ou a formatação das respostas, em vez de identificar métricas reais de qualidade, como precisão factual e relevância. A raiz do problema está no fato de que os objetivos de treinamento padrão não conseguem distinguir entre associações falsas presentes nos dados de treinamento e fatores causais reais. Essa falha resulta em modelos de recompensa frágeis (RMs), gerando estratégias desalinhadas.

Jul 4, 2025

MiniMax lança o primeiro modelo de inteligência artificial de grande escala de código aberto do mundo, uma inovação tecnológica que chama a atenção da indústria

Jul 4, 2025

Kunlun Tech abre novamente o modelo de recompensa Skywork-Reward-V2

Em 4 de julho de 2025, a Kunlun Tech avança com a abertura do segundo modelo de recompensa da série Skywork-Reward-V2. Esta série inclui 8 modelos de recompensa baseados em diferentes modelos-base, com tamanhos de parâmetros variando de 600 milhões a 8 bilhões. Ao ser lançado, conquistou totalmente as sete principais listas de classificação de modelos de recompensa. Tornou-se o foco no campo dos modelos de recompensa de código aberto. Os modelos de recompensa desempenham um papel crucial no processo de aprendizado por reforço com feedback humano (RLHF). Para criar um novo modelo de recompensa, a Kunlun Tech construiu uma coleção de 40 milhões

Jul 4, 2025

O modelo de geração de vídeo Google Veo 3 está disponível para assinantes Pro/Ultra, incluindo nova funcionalidade de geração de vídeo a partir de fotos

A Google anunciou globalmente que seu novo modelo de geração de vídeo com IA chamado Veo3 está oficialmente disponível para assinantes Google AI Pro e Ultra. Este modelo de geração de vídeo desenvolvido pelo Google DeepMind tornou-se rapidamente o foco da indústria de geração de vídeos com IA, graças à sua excelente qualidade de imagem em alta definição, capacidade de sincronização de áudio e vídeo e funcionalidades de criação multimodal. Veo3: Redefinindo a geração de vídeos com IA, apresentado pela primeira vez na conferência Google I/O de 2025.

Jul 4, 2025

Xiaopeng G7 Ultra chega com força! Novo modelo de condução autônoma inteligente é lançado

No mercado de veículos elétricos, a Xiaopeng Motors novamente chama atenção. Em 3 de julho, o Xiaopeng G7 Ultra foi oficialmente lançado, tornando-se o primeiro veículo inteligente a montar o modelo "VLA+VLM" local. Essa inovação tecnológica marca um passo importante para a Xiaopeng no campo da condução autônoma. O Xiaopeng G7 Ultra é equipado com o modelo VLA (capacidade de pensar ativamente e tomar decisões rapidamente), tornando a experiência de direção mais inteligente. No dia a dia, o G7 Ultra consegue lidar flexivelmente com diversos cenários complexos de direção, como em tráfego denso.

Jul 4, 2025

Jornal A: Bilibili atualiza o modelo de geração de vídeos animados AniSora V3; ByteDance abre o framework de geração de vídeo 4D EX-4D; Sistema de agente de IA DeepSWE é lançado com força

Jul 3, 2025

Novo modelo aberto pela ByteDance VINCIE-3B: 300 milhões de parâmetros, suporte para edição contínua de imagens no contexto

Jul 3, 2025

Modelo de geração de vídeos animados de código aberto Bilibili AniSora V3 Versão: Gere várias estilos de cenas de vídeos animados com um clique

Jul 3, 2025

Amazon lança novo modelo de IA Deep Fleet, número de robôs ultrapassa o milhão

Em uma importante declaração recente, a gigante do comércio eletrônico e nuvem global Amazon revelou dois importantes marcos em tecnologia robótica e inteligência artificial (IA): o lançamento de um novo modelo de grande base de IA chamado Deep Fleet, e o sucesso no desdobramento de mais de um milhão de robôs. O lançamento do modelo Deep Fleet visa melhorar a inteligência e a eficiência da maior frota de robôs móveis industriais do mundo da Amazon. A aplicação deste modelo deve aumentar em 10% a eficiência das viagens da frota de robôs, acelerando assim

Jul 3, 2025

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral

Alibaba lança seu primeiro modelo multimodal completo, Qwen2.5-Omni, desafiando gigantes da tecnologia global

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

​Google lança novo modelo de geração de vídeo Veo 3 em todo o mundo

DeepMind lança Crome: melhorando a alinhamento de grandes modelos de linguagem com o feedback humano

MiniMax lança o primeiro modelo de inteligência artificial de grande escala de código aberto do mundo, uma inovação tecnológica que chama a atenção da indústria

Kunlun Tech abre novamente o modelo de recompensa Skywork-Reward-V2

O modelo de geração de vídeo Google Veo 3 está disponível para assinantes Pro/Ultra, incluindo nova funcionalidade de geração de vídeo a partir de fotos

Xiaopeng G7 Ultra chega com força! Novo modelo de condução autônoma inteligente é lançado

Jornal A: Bilibili atualiza o modelo de geração de vídeos animados AniSora V3; ByteDance abre o framework de geração de vídeo 4D EX-4D; Sistema de agente de IA DeepSWE é lançado com força

Novo modelo aberto pela ByteDance VINCIE-3B: 300 milhões de parâmetros, suporte para edição contínua de imagens no contexto

Modelo de geração de vídeos animados de código aberto Bilibili AniSora V3 Versão: Gere várias estilos de cenas de vídeos animados com um clique

​Amazon lança novo modelo de IA Deep Fleet, número de robôs ultrapassa o milhão

Google lança novo modelo de geração de vídeo Veo 3 em todo o mundo

Amazon lança novo modelo de IA Deep Fleet, número de robôs ultrapassa o milhão